>Здрасти TodProg [Тош],
Здрасти.
"Jabberwock е само програма и изобщо не е "представителна извадка за нивото на науката за обработка на естествени езици"."
Това е добре...
Можеш ли да ми посочиш нещо "по-научно" и представително?
"Jabberwock е един от победителите. Смятам, че забеляза каква е разликата от диалог с "него" и другите програми."
Verbot-4 е несравним с останалите два. За мен обаче Алиса (стара моя позната) е по-умна от Jabberwock.
"Може ли да дадеш дефиниция на изчислително езикознание, защото не съм сигурен какво значи това. Може би имаш пред вид използваните от Чомски "Linguistic Competence" или "Linguistic Performance""
С "изчислително езикознание" имам предвид само името на науката "computational linguistics" - което в дословен превод е "изчислително езикознание". Бих го казал и: езиковедски изследвания и разработки (във всякаква част на езикознанието), които използват изчисления и си служат и с математически модели и изчислителни машини.
"Колкото до създателите на Jabberwock - верно се унижиха с 2000$ ама какво да се прави..."
Прав си - 2000 долара са показателна награда за създаване на изкуствен "разум".
Колко хора биха дали пари за толкова "умни" машини, която не могат да свържат две изречения? /Много, щом тези машнини са достъпни през Интернет, и щом 2000 долара са голяма награда/.
И какво са 2000 долара за изследовател? Можеш ли да си купиш суперкомпютър (да кажем поне няколкостотин GFLOPS и стотина GB RAM), на който да симулираш моделите на разум, които изграждаш? Можеш ли да набереш още разработчици към изследователските си екипи и за колко време ще ги издържаш? Можеш ли дори да се самофинансираш, като си вземеш отпуска от редовната работа, която вършиш, за да работиш по тези изследвания? Ако си на Запад и си "най-обикновен" програмист, ще печелиш два пъти повече на месец с рутинна работа.
На фона на тези 2000 долара, създателите на Мислеща машина, която ще може да води свободен разговор (разговор, а не извеждане на нещо, свързано с последния въведен ред, но не и с предпоследния), набързо биха станали милионери, че и милиардери от ----> продажби, <----, подобно на Возняк, Джобс, Гейтс, Уолфрам. Те отвориха пазари, в които се породи голямо търсене, и хората намираха тях.
"Не съм сигурен, че разбирам идеята ти за влагането на изкуство в "науката за обработка на естествени езици".
Може ли да дадеш примери за това."
Да... Може би няма да мога да го изразя ясно и сега; преди да изпълня достатъчно голяма част от Плана си за обстойно и подплътено с опити изследване на разума, езика и творчеството; и построяване на разум и език (езици) на разума от "нищото" чрез надграждане на частите и обосноваване на нуждата от тях.
Имам предвид да се "кривне" от установеното от науката, да се забравят някои нейни термини и схеми.
Да се пробва да се измисли нещо като се тръгне от основите, с целта то да тръгне по друг път, който е по-плодотворен откъм разбиране и моделиране на разума и езика.
Да се работи по изследване на разума и творчеството, а езика да се разглежда като следствие и страничен ефект на действието на разума и като средство за творчество.
Да се използват методите и уменията на т.нар. "юнаци".
"Юнаци", според Юнашкото наречие:
http://www.geocities.com/eimworld/dzbe са хора, които изпълняват следните условия.
Притежават наклонности в областите:
- математика - алгоритмизиране, формализиране
- езикови - писане; езикознание
- философия - "фантазьорство", желание да се мисли, да се анализира и разбира всичко
Както и желание и дарба да творят в горните области, и в поне един от двата вида изкуства: изобразителни и музикални/звукови. "Свещеният сметач" е пример за "юнашко" списание:
http://www.geocities.com/eimworld/Под "влагане на изкуство" разбирам например изследване на начина по който се извършва словесното творчество (част от моята Програма), от хора, които извършват словесно творчество, и в същото време разбират от информатика и имат усет за това да формализират и моделират това, което разбират за начина по който творят, по който търсят и избират сюжети, теми, герои, събития, и по който ги описват.
....
Ето пример за "изкуство в опит за наука", за фантазиране в текст, който се опитва да бъде малко "научен", и се отнася за [изчислително] езикознание, семантика, семиотика:
"Анализ на смисъла на изречение въз основа на базата знания на действаща мислеща машина. Мисли за смисъла и изкуствената мисъл.", който публикувах на bgit.net и тук:
http://www.geocities.com/eimworld/razumпреди година:
--- ЦИТАТ ---
....
"Безсмислени" кратки изречения - които и човек не може да разтълкува еднозначно и е необходимо да добави смисъл от паметта си, или пък да попита този, който ги е изпуснал "от нищото", за уточнение - се използват от някои изследователи за отричане на изкуствения разум.
Да видим например "класически" пример за "неспособността на машината да превежда", взет от изчислителното езикознание:
Time flies.
"Ужас"! Не може да се преведе!
Как машината би превела това изречение на български? "Времето лети" или "Времеви мухи"? /А защо не по друг начин? "Time" не означава само "време", нито пък "flies" значи само мухи: това са само първите две неща, които ми хрумнаха. Търсенето беше ограничено до две "неща"; до две възможни тълкования. За този вид несъзнателно ограничаване на пространството на търсене, водещо до прибързано заключение за значението, ще стане дума малко по-късно./
Колега: "Времето лети", разбира се. Няма такъв израз "времеви мухи"... Нито пък някакъв друг...
Защо мислите така, колега?
Колега: Защото "времеви мухи" няма смисъл... Всъщност защото аз бих го превел така; а мисля, че съм достатъчно добър преводач. Можете да проверите личната ми страница: сам съм си я писал.
А защо Вие бихте го превели така?
Колега: Защото... Защото не съм чувал израз "времеви мухи"...
Следователно сте изключили възможността да чуете изречение, в което се използва израз, който досега не сте чували?
Колега: Да...
Кой Ви каза това изречение?
Колега: Не знам... Май че Вие, но нито Ви виждам, нито Ви чувам... Но май че... Доколкото разбирам... Възможно е "time flies" да е идиом, който не съм чувал... Може ли да ми го разясните?
Ами...
Колега: Какво значи изразът "time flies"? Някакъв особен вид мухи може би? Или пък... Как не се бях сетил досега! /А уж съм любител на научната фантастика.../ Полети през времето! "Time flies" означава пътувания през времето!
Двусмислието идва от това, че не е избран критерий за отсичане. До момента, в който не се извършва никакво действие, причинено от входните данни, които се смятат за нееднозначни, нееднозначността не е проблем: запомня се цялото изречение като изречение - дума по дума - и се знае, че "всичките възможности са възможни".
Когато трябва да се извърши еднозначно действие обаче, - например робот да хване или десния куб, или средния цилиндър - трябва отнякъде да се вземе допълнителен признак, въз основа на който да се реши кое от всички значения
да се приеме за двигател на текущото действие; след като входните данни са нееднозначни, следователно те не определят еднозначно действие, следователно което и действие да се извърши, - избрано въз основа на спомените на разума - няма да е "грешка".
Т.нар. "естествен" език, или Език на разума, както авторът на тази работа предпочита да го нарича, позволява нееднозначност може би защото при него има много "правилни" възможности; съществуват много случаи, в които всяко възможно решение е "правилно" в смисъл, че устройството (човекът), което го е взело, продължава да работи след прилагането му в действителността.
Ако дадена машина продължи да работи - съгласно разбирането за "работи"; напр. сърцето й да бие [т.е. тактовите й генератори да работят - поетичен израз от Юнашкото наречие] - за еди-каква си продължителност след извършване на еди-какво си действие, то действието й е било "правилно", т.е. тя е следвала закони, които не водят до повреда или "излизане от строя".
По-сложните управляващи устройства (виж "Схващане за всеобщата предопределеност":
http://eim.hit.bg/razum) имат по-голямо пространство на правилните решения; имат по-голяма "свобода", т.е. възможности за бъдещо действие, след което да продължат да работят правилно.
Нищо не е "безсмислено", колеги...
Винаги можеш да извлечеш смисъл, т.е. ВРЪЗКА от едно "нещо" към друго "нещо". Смисълът е ВРЪЗКА между "неща". Най- лесно се пречертава вече известна връзка, поради което първоначалната нагласа при възприемане на "безсмислен" израз е да се провери: съществуват ли предварително изчислени връзки - смисъл - с дадения израз. Ако съществуват, тези връзки се виждат като "сиви линии". Когато човек види сива линия върху бял лист и има черен молив в ръка (да речем "шест пъти бе") и му заръчаме да начертае линия по първия начин, който му хрумне, най-вероятното му действие ще е да потъмни сивата линия.
Така направи измисленият "колега" по-горе: той "пречерта" връзката към смисъла "времето лети" и отхвърли възможността "time flies" да има приложения, които все още са неизвестни за неговата съвкупност от знания и трябват тепърва да бъдат пресметнати и "начертани" в паметта му.
. . . . .
Нека за забавление разгледаме израза "time flies" в друг случай.
Да си представим едно тригодишно детенце англичанче - Джони - което знае че "fly" е муха /едно такова мъничко черничко дето жужи и хвърчи; и като ти кацне на лицето те гъделичка и ти се опитваш да го изгониш, като махаш с ръце.../; Джони знае как се образува множественото число на муха - "flies"; Джони не знае обаче, че "fly" значи полет; за Джони "time" означава "часовник". Джони знае, че "clock" и "watch" също означава часовник: едно такова кръгло, дето има едни дълги, дето се въртят; тънките дълги се въртят бързо, а по-дебелите - много бавно; дебелите понякога даже изобщо не се въртят, а като си поиграеш с количките и после ги погледнеш - изглеждат по различен начин...
Знае какво е "watch" и "clock", но винаги, когато околните му хора са си говорили за време, то е виждало часовници. Джони е чувал баща си да казва: "Нямаме време. Трябва да побързаме" и когато го е казвал, бащата е поглеждал часовника си. Така у тригодишния Джони представата "време" се е свързала с представата "часовник" и когато той чуе "време", се сеща за "часовник".
Да си представим, че си слагаме голям и пъстър часовник на ръката и отиваме да си играем с това дете на детската площадка. / То няма часовник./
Какво ще направи Джони, ако изведнъж му кажем: "Time flies!"
Прозорлив колега: Най-вероятно ще погледне към пъстрия часовник и ще потърси мухи около него...
Именно! А какво ще направи, ако нямаме часовник?
Прозорлив: Може би ще погледне към ръката ни и да потърси часовник, около който летят мухи... Джони знае, че часовникът на баща му - предметът, с който свързва "time" - се намира на лявата му китка. Ако не е запомнило "ляво" и "дясно", ще го потърси и на двете ръце.
Какво си е помислил Джони, след като търси часовник и мухи?
Прозорлив: В ума му са се върнали образи, които свързва с "време" и с "мухи"... След като се появят тези мисли, Джони търси тяхно проявление, достъпно през входните му устройства: сетивата. Конкретният начин, по който търси, зависи от подробностите на средата.
Машината има нужда от среда, в която допълнително да търси смисъл: СЪВПАДЕНИЯ на образи, имена, особености, съчетания.
А какво ще направи Джони, след като открие, че около часовника няма мухи, или дори нямаме часовник?
Прозорлив: Зависи от състоянието на ума му и от поведенческия модел, който в момента, в който се случва тази случка, е избрал. Джони може да запомни израза "time flies" като представа, която означава това, което му е хрумнало веднага: "мухи около часовник" и да не предприеме нищо; да чака да срещне употреба на "time flies" в по-богата откъм подробности среда, така че да може да извлече и потвърди смисъла - ПОДРОБНОСТИТЕ, уточненията; силите, които намаляват пространството на търсене.
Може да не си направи никакъв извод. Да възприеме израза като безсмислица и да го подмине. Да не го запомни.
Джони може и веднага да ни попита:
- Какво значи "time flies"?
Така трябва да може да прави и машината, която - подобно на тригодишния Джони - ще се нуждае и от наставници и учители, докато се развива.
От това какво ще му отговорим ние и какво доверие има то към значенията, които му разясняваме, зависи какъв смисъл ще научи детето: по какъв начин ще ограничи пространството на търсене; или как ще разшири пространството на търсене, като добави възможност, за която не е подозирало.
Ако обясним на Джони, че "time flies" значи "времето никога не стига", то може да го запомни като цяло изречение: устойчива поредица от думи, към която "time flies" само препраща; т.е. когато Джони пак възприеме "time flies", той ще се сеща направо за "времето никога не стига" и ще търси смисъл в него, като срещата на "time flies" ще служи като преход при проверка на верността на условие в предписание за изчислителна машина.
Можем да обясним на Джони, че "flies" значи лети, без да разясняваме отвлечения смисъл на "време": отношение на последователност събития - преди, след, заедно. Тогава Джони може да продължи да свързва "time" с "часовник" и да започне да си представя "time flies" като "часовникът лети". Възможно е в мига, в който му го казваме, да затърси с поглед часовник, който да хвърчи около нас, в търсене на проявление (входни данни), което да затвърди образуваната връзка; или пък просто когато чуе "time flies" ще си представя летящ часовник и ще си мисли, замечтан: "Дали летящите часовници имат крила?"
"Ще си представя" е ключова част на изречението. Когато търсим смисъл, трябва да можем да си представяме. Това означава един вид възприятия да пораждат друг вид; единият вид може да е "действителен", т.е. възприет от входен канал, който се смята за "първичен"; свързан с "действителността", а другият: вторичен - породен от въображението.
Можем да кажем нещо и в този смисъл. Човек обикновено смята за "реални" входни канали зрението, слуха, осезанието, вкуса, мириса; когато през тях възприема данни с максимален обем.
Зрението е първичен входен канал, когато с него възприемаме изображения, в които можем да различим точки. Буквите, цифрите и препинателните знаци се възприемат през вторичен входен канал, защото от първичния канал - зрението, което вижда изображения с максимална разделителна способност, описващи се точка по точка, като всяка точка може да получава стойност за "цвят" и "яркост", които не са обвързани със съседните - се извличат данни с по-малък обем: букви, цифри, геометрични фигури.
....
--- КРАЙ НА ЦИТАТА ---
"Интересно беше едно приложение за изчислителен хумор, адрес към което не поствам само защото не може да се тества от страницата на проекта. Става дума за автоматично съставяне/интерпретиране на акроними. Проектът се казва Ha-Ha (сериозно)"
Част от Програмата ми за изследване е построяване на "творци", въз основа на разбраното за начина по който аз самият творя:
как се търсят думи, за да се сглобят изречения (построяване на изречения частица по частица, не пряко чрез думи, а чрез по-сложни и заобиколни структури, от които се извеждат думи).
Как се свързват изречения и смисли в словестни творби - от най-късите жанрове като хайку и отделни изречения, породени от някакво непосредствено възприятие, през текстове на песни, лирични разкази...:
Това е откъс от лиричен разказ:
"...Присъдата ми е доживотна, при строг тъмничен режим, и нямам право на свиждане. Единствено безсмъртната Надежда успява да се промъкне през тесните цепнатини между непробиваемите плътни черни ледени блокове на Отчаянието. Тя идва при мен когато съм най-тъжен и започва да ме увещава да избягам с нея; влиза неочаквано в килията ми и ме упоява с мечти. Сваля оковите ми, докато съм унесен, и ме пренася в Стаята за въжделения. Там ме завързва за Стола на илюзиите и ме измъчва с вяра в любовта."
обикновени разкази и до най-големите и сложни: художествени и "художественонаучни" романи, и философия. Как се преценява (как би могло да се преценява, така че резултатът да е правдоподобен на резултата при преценяване от някой човек), че текстът е "художествен", "реалистичен", "смешен" и т.н.; защо в някой случай някой определя нещо като "по-реалистично" от друго, или с по-добър стил и пр.
Започнах този "голям абзац", защото смешното е част от Плана (правил съм такива опити отдавна, но много кратки и все още без добра формализация; има във фантазията на име "Вселена и разум 4"). Много от похватите за създаване на смях са очевидни - проблемът е да се опишат в подходящи структури, така че да могат да се използват от машина без човешка намеса.
За илюстрация на това колко са очевидни някои "смехопородителни" похвати. В "Шоуто на Слави", където "бълват" формалистични смешки, ги използват.
Например:
-- Език богат на определения, изпълващи задъханата от ежедневните тревоги душа на обикновения човек със свеж въздух, ухаещ на приятни мисли и добро настроение.
-- Включване на много фактологични подробности, свързани с текущи събития и образи, построени по-рано от разказвача в други разкази; съчетаване на несъвместими (невероятни, разминаващи се във времето) събития; използване на клишета (това е много смешно); много връзки между частите - така се създава реалистично звучене и се увлича слушателят. Оригиналничене с многозначни недоизказани изрази....
Импровизация:
Пешо Мълдъров Скълиев, тракторист от ТКЗС-то в село Мало Големово, община Перник, окръг София, се люлееше в мрака по пътя от кръчмата на местния чорбаджия Марко Винарски към дома, където до мивката го чакаше вярната му съпруга Кръшка Скълиева, която поради вечните му запои се бе принудила да повика водопроводчик да я оправи.
Клатше се Пешо по пътя, клатеше се, и тъкмо когато щеше да се подхлъзне на една кравешка фъшкия и да падне до телефонния стълб, на който се блещеше некрологът на дядо Мълдьо Скълиев, бащата на Пешо - преди два дена му направиха помена за 40 дни, - когато върху калния селски път от небето се спусна ярък светлинен лъч. По-ярък даже от фаровете на комбайна "Нива" на окъснелия съселянин и комбайнероинтелигент Слави преди три дни, миг преди да ги загаси, защото вместо да вършее житото вършеше една тънка частна незаконна работа на задната седалка, и се страхуваше от народната власт, кметицата леля Стефка Малоголемова, майка на неговата бизнеспартньорка.
Следва продължение...
--- "Оригинални" имена, които описват носителите им, "мръсни думи" и насърчаване на "мръсно подсъзнание" - "мръсотиите", изказани по телевизията са много смешни, защото в повечето предавания не се говори така, това е "оригинално" - прикрити зад "оригинални" имена, в които се съдържа "мръсния" смехопораждащ корен в основна форма или с някой сменен звук. "По-оригинални имена" са такива, които се срещат по-рядко отколкото други, които са по-"обикновени".
Например:
Мила, моят приятел Курти влезе. Чукохвъргачката Лиза Мишпека постави световен рекорд. Несетилият женска ласка Сам Шепърд пристъпи към жрицата на любовта. Чикистът Хулио Педро Педраса де Лакоруня вдигна високо своята бунтовническа пушка, по чийто дървен приклад се белееха резки от много успешни попадения в целта. Попфолкпевицата Радка Пираткова дойде с бял Мерцедес....
.....
Подробно изследване, описание и подплътяване с голямо количество примери за похватите при съставяне на словесни творби, съчетано с построяване на структури и математически модели на разбраното, и моделиране на налучканите механизми за построяване на словесни творби, е "използване на изкуство в изчислителното езикознание".
Поздрави.
[This message has been edited by Tosh (edited 23-04-2005).]