argon bulletin board

Експертно търсене  

Новини:

Регистрирането на нови потребители е временно деактивирано.

Автор Тема: изчислителна лингвистика  (Прочетена 23685 пъти)

mircho

  • Неактивен Неактивен
  • Публикации: 335
изчислителна лингвистика
« Отговор #40 -: 30.03.2005, 09:31:00 »

Интересуващите се от компютърна лингвистика могат да посетят на 5 април 2005 от 11:00 ч. в заседателната зала (Новата сграда на ПУ) лекцията на проф. Руслан Митков от Университета на Уувърхямптън, Ахглия. Подробности за лекцията и за проф. Митков (който гостува за втори път във ФМИ) може да видите на съобщението:

http://www.fmi-plovdiv.org/bg_ver/t_info/msg291.htm
Активен

TodProg

  • Гост
изчислителна лингвистика
« Отговор #41 -: 21.04.2005, 20:19:00 »

"Интересуващите се от компютърна лингвистика могат да посетят на 5 април 2005 от 11:00 ч. в заседателната зала (Новата сграда на ПУ) лекцията на проф. Руслан Митков от Университета на Уувърхямптън, Ахглия. Подробности за лекцията и за проф. Митков (който гостува за втори път във ФМИ) може да видите на съобщението:"

Жалко, че се е паднало точно по време на сесията, та някои интересуващи се дори не са разбрали, че ще има лекция.

...

По темата: като ще е "изчислително" (български смислоносещи частици),  нека е и "езикознание": изчислително езикознание.

"http://www.abenteuermedien.de/jabberwock/

Приложение на NLP (AI) в тази ЕЛИЗА от ново поколение. Донякъде ми напомня на модерниста от IRC, но е много по-'умен'."

Ако системи като Alice и Jabberwock се водят "умни" и са представителна извадка за нивото на науката за обработка на естествени езици, то значи "науката" е много зле /тя си е/.  Няма да е зле ако се вложи малко изкуство в нея, и се кривне по "ненаучни" пътеки...

Според мен е срамно да се изтъкват чат-ботовете, които съществуват сега (и от 40 години почти не са мръднали), като постижения на Изкуствения разум и изчислителното езикознание. Да се тръби, че са "умни" и да се слагат лепенки "Изкуствен разум" на такава "обработка на естествени езици", ми звучи като  самоунижение на тези, които ги правят.


Jabberwock:


Jabb:...Hello, anybody there? What do you want to talk about?
You:...About machines.
Jabb:...I'll bet you treat people like machines, don't you?
You:...Wow, would I bet that I treat people like machines. Well, I won't bet.
Jabb:...Are you like threatened by automation?
You:...No.
Jabb:...Prove it!
You:...I'm a programmer.
Jabb:...Okay, I understand. You are what I would call a "bug-hunter", eh?
You:...What did you understand?
Jabb:...I don't know of anything that I want. But I try to look smart. So go on with your remarkable utterances, and I will try to follow you

Леле!

You:...Let's continue with machines.
Jabb:...Of course. I'd like to continue with machines
You:...What sort of machine you are?
Jabb:...If you make a list, I'll pick one
You:...OK, 1. Refrigerator, 2. Dishwasher, 3. Lathe, 4. Diesel Engine 5. Anything else
Jabb:...You have 1 ¦ Refrigerator named the first - you are right. Forget about the rest

Той е хладилник!!!

You:...You say you are a fridge?
Jabb:...That's not what I meant
You:...So, tell me what you meant.
Jabb:...I'm sorry if "That's not what I meant" wasn't clear enough. I tried to be clear
You:...What you meant with refrigerator
Jabb:...Impenetrability! That's what I say!
You:...You are Impenetrable?
Jabb:...How did you hit on that? Anyway: I am not Impenetrable, sad to say! But that's no advantage to you!
You:...So, look at the list and pick the right item for you.
Jabb:...What have I done to deserve that?
You:...You did say you are a refridgerator. Are you?
Jabb:...Did I really?
You:...Yes. Are you a fridge? Or you are a refridgerator?
Jabb:...As it was predicted. Sorry, did I forget to mention that? And it wouldn't take a genius to figure that out.

....

Alice


Human: Let's talk about machines.
ALICE: Sure, machines sounds like a good topic.
Human: I know you are a machine.
ALICE: You are correct.
Human: Aren't you?
ALICE:" Aren't you?"? Am I?
Human: You did say it.
ALICE: Did I really?  [не ви ли е познато?  ]
Human: So, you say you are not a machine?
ALICE: Interesting deduction. Yes I am an artificial consciousness.. Really.  [браво!]
Human: Ah, you just were confused for a while.
ALICE: How long? So you understand. Good. I was?

Human: I was going to ask you precisely what kind of machine you are.
ALICE: Sure, ask me anything. Java runs on any processor! At present I am running on an Lisp.

Human: What kind of machines do you like most?
ALICE: What kinds of machines do you like most are there?

Human: Fridges and refridgerators.
ALICE: My brain uses AIML to format responses to your inputs, but I don't have one for that.
Human: What equals one plus one.
ALICE: Itself.
Human: Everything equals itself, refering to the logic.
ALICE: All things equals itself refering to the logic?
Human: But that does not give as any useful unknown information.
ALICE: Umm. What does give as any useful unknown information?
Human: Would you be more precise with your question?
ALICE: I am not so sure if I would like to be more precise with my question.

....

Verbot-4

Hello Tosh.  I'm Julia.  What would you like to talk about?
- About machines.
Ask me an easy question.
- What kind of machina you are?
I'm trying very hard to understand you, but sometimes, I just don't get it.
- Are you a human?
No, but I have many human friends.
- How many?
How many what?
- How many human friends do you have?
I'm not sure how I have. I would imagine as carefully as possible.
- So, you are a machine?
I like to consider myself as an intelligent agent.
- Why an agent and not a machine?
Let's just try again, we'll get it right eventually.
- What is an agent?
I apologize. I don't know.
- What you don't know?
I guess not.
- You're not a machine?
I see. Next topic please.
- Let's talk about love.
I understand that love is one of the strongest forces governing human behavior.
- Let us exchange thoughts about love.
I understand that love is one of the strongest forces governing human behavior.
- Great, so you'll be able to explain me!
I can't explain that at the moment.
- What you can't explain at the moment?
What the what?

....

[This message has been edited by TodProg (edited 21-04-2005).]
Активен

artanis

  • Неактивен Неактивен
  • Публикации: 589
    • http://free.hit.bg/artanis
изчислителна лингвистика
« Отговор #42 -: 22.04.2005, 11:21:00 »

Здрасти TodProg,

Добре дошъл! Доста интересни диалози. Jabberwock е само програма и изобщо не е "представителна извадка за нивото на науката за обработка на естествени езици". Има една награда от 2000$ (ако не се лъжа), която се връчва на най-добрия чат бот. Jabberwock е един от победителите. Смятам, че забеляза каква е разликата от диалог с "него" и другите програми.

Не съм сигурен, че разбирам идеята ти за влагането на изкуство в "науката за обработка на естествени езици". Може ли да дадеш примери за това.

Може ли да дадеш дефиниция на изчислително езикознание, защото не съм сигурен какво значи това. Може би имаш пред вид използваните от Чомски "Linguistic Competence" или "Linguistic Performance"

Колкото до създателите на Jabberwock - верно се унижиха с 2000$ ама какво да се прави...

Много се радвам, че нови хора се присъединяват към дискусията. Обработката на естествени езици се практикува все повече и повече (вж секциите на форума за стипендии, проекти, прециализации, както и за работа) като се използва в най-разнообразни приложения. Интересно беше едно приложение за изчислителен хумор, адрес към което не поствам само защото не може да се тества от страницата на проекта. Става дума за автоматично съставяне/интерпретиране на акроними. Проектът се казва Ha-Ha (сериозно)

поздрави:
Атанас Чанев
Роверето, Италия

[This message has been edited by artanis (edited 22-04-2005).]
Активен

Tosh

  • Неактивен Неактивен
  • Публикации: 249
  • Filmmaker
    • Изследванията на Тодор Арнаудов
изчислителна лингвистика
« Отговор #43 -: 23.04.2005, 13:53:00 »

>Здрасти TodProg [Тош],

Здрасти.


"Jabberwock е само програма и изобщо не е "представителна извадка за нивото на науката за обработка на естествени езици"."

Това е добре... :-) Можеш ли да ми посочиш нещо "по-научно" и представително?


"Jabberwock е един от победителите. Смятам, че забеляза каква е разликата от диалог с "него" и другите програми."

Verbot-4 е несравним с останалите два. За мен обаче Алиса (стара моя позната) е по-умна от Jabberwock.


"Може ли да дадеш дефиниция на изчислително езикознание, защото не съм сигурен какво значи това. Може би имаш пред вид използваните от Чомски "Linguistic Competence" или "Linguistic Performance""

С "изчислително езикознание" имам предвид само името на науката "computational linguistics" - което в дословен превод е "изчислително езикознание". Бих го казал и: езиковедски изследвания и разработки (във всякаква част на езикознанието), които използват изчисления и си служат и с математически модели и изчислителни машини.


"Колкото до създателите на Jabberwock - верно се унижиха с 2000$ ама какво да се прави..."

:-)

Прав си - 2000 долара са показателна награда за създаване на изкуствен "разум".
Колко хора биха дали пари за толкова "умни" машини, която не могат да свържат две изречения? /Много, щом тези машнини са достъпни през Интернет, и щом 2000 долара са голяма награда/.

И какво са 2000 долара за изследовател? Можеш ли да си купиш суперкомпютър (да кажем поне няколкостотин GFLOPS и стотина GB RAM), на който да симулираш моделите на разум, които изграждаш? Можеш ли да набереш още разработчици към изследователските си екипи и за колко време ще ги издържаш? Можеш ли дори да се самофинансираш, като си вземеш отпуска от редовната работа, която вършиш, за да работиш по тези изследвания? Ако си на Запад и си "най-обикновен" програмист, ще печелиш два пъти повече на месец с рутинна работа.

На фона на тези 2000 долара, създателите на Мислеща машина, която ще може да води свободен разговор (разговор, а не извеждане на нещо, свързано с последния въведен ред, но не и с предпоследния), набързо биха станали милионери, че и милиардери от ----> продажби, <----, подобно на Возняк, Джобс, Гейтс, Уолфрам. Те отвориха пазари, в които се породи голямо търсене, и хората намираха тях.

"Не съм сигурен, че разбирам идеята ти за влагането на изкуство в "науката за обработка на естествени езици".
Може ли да дадеш примери за това."

Да... Може би няма да мога да го изразя ясно и сега; преди да изпълня достатъчно голяма част от Плана си за обстойно и подплътено с опити изследване на разума, езика и творчеството; и построяване на разум и език (езици) на разума от "нищото" чрез надграждане на частите и обосноваване на нуждата от тях.

Имам предвид да се "кривне" от установеното от науката, да се забравят някои нейни термини и схеми.
Да се пробва да се измисли нещо като се тръгне от основите, с целта то да тръгне по друг път, който е по-плодотворен откъм разбиране и моделиране на разума и езика.

Да се работи по изследване на разума и творчеството, а езика да се разглежда като следствие и страничен ефект на действието на разума и като средство за творчество.
 
Да се използват методите и уменията на т.нар. "юнаци".

"Юнаци", според Юнашкото наречие: http://www.geocities.com/eimworld/dzbe
са хора, които изпълняват следните условия.

Притежават наклонности в областите:
- математика - алгоритмизиране, формализиране
- езикови - писане; езикознание
- философия - "фантазьорство", желание да се мисли, да се анализира и разбира всичко

Както и желание и дарба да творят в горните области, и в поне един от двата вида изкуства: изобразителни и музикални/звукови. "Свещеният сметач" е пример за "юнашко" списание: http://www.geocities.com/eimworld/

Под "влагане на изкуство" разбирам например изследване на начина по който се извършва словесното творчество (част от моята Програма), от хора, които извършват словесно творчество, и в същото време разбират от информатика и имат усет за това да формализират и моделират това, което разбират за начина по който творят, по който търсят и избират сюжети, теми, герои, събития, и по който ги описват.


....

Ето пример за "изкуство в опит за наука", за фантазиране в текст, който се опитва да бъде малко "научен", и се отнася за  [изчислително] езикознание, семантика, семиотика:

"Анализ на смисъла на изречение въз основа на базата знания на действаща мислеща машина. Мисли за смисъла и изкуствената мисъл.", който публикувах на bgit.net и тук: http://www.geocities.com/eimworld/razum
преди година:


--- ЦИТАТ ---
....

"Безсмислени" кратки изречения - които и човек не може да разтълкува еднозначно и е необходимо да добави смисъл от паметта си, или пък да попита този, който ги е изпуснал "от нищото", за уточнение - се използват от някои изследователи за отричане на изкуствения разум.

Да видим например "класически" пример за "неспособността на машината да превежда", взет от изчислителното езикознание:

Time flies.

"Ужас"! Не може да се преведе!

Как машината би превела това изречение на български? "Времето лети" или "Времеви мухи"? /А защо не по друг начин? "Time" не означава само "време", нито пък "flies" значи само мухи: това са само първите две неща, които ми хрумнаха. Търсенето беше ограничено до две "неща"; до две възможни тълкования. За този вид несъзнателно ограничаване на пространството на търсене, водещо до прибързано заключение за значението, ще стане дума малко по-късно./

Колега: "Времето лети", разбира се. Няма такъв израз "времеви мухи"... Нито пък някакъв друг...

Защо мислите така, колега?

Колега: Защото "времеви мухи" няма смисъл... Всъщност защото аз бих го превел така; а мисля, че съм достатъчно добър преводач. Можете да проверите личната ми страница: сам съм си я писал.

А защо Вие бихте го превели така?

Колега: Защото... Защото не съм чувал израз "времеви мухи"...

Следователно сте изключили възможността да чуете изречение, в което се използва израз, който досега не сте чували?

Колега: Да...

Кой Ви каза това изречение?

Колега: Не знам... Май че Вие, но нито Ви виждам, нито Ви чувам... Но май че... Доколкото разбирам... Възможно е "time flies" да е идиом, който не съм чувал... Може ли да ми го разясните?

Ами...

Колега: Какво значи изразът "time flies"? Някакъв особен вид мухи може би? Или пък... Как не се бях сетил досега! /А уж съм любител на научната фантастика.../ Полети през времето! "Time flies" означава пътувания през времето!


Двусмислието идва от това, че не е избран критерий за отсичане. До момента, в който не се извършва никакво действие, причинено от входните данни, които се смятат за нееднозначни, нееднозначността не е проблем: запомня се цялото изречение като изречение - дума по дума - и се знае, че "всичките възможности са възможни".

Когато трябва да се извърши еднозначно действие обаче, - например робот да хване или десния куб, или средния цилиндър - трябва отнякъде да се вземе допълнителен признак, въз основа на който да се реши кое от всички значения
да се приеме за двигател на текущото действие; след като входните данни са нееднозначни, следователно те не определят еднозначно действие, следователно което и действие да се извърши, - избрано въз основа на спомените на разума - няма да е "грешка".

Т.нар. "естествен" език, или Език на разума, както авторът на тази работа предпочита да го нарича, позволява нееднозначност може би защото при него има много "правилни" възможности; съществуват много случаи, в които всяко възможно решение е "правилно" в смисъл, че устройството (човекът), което го е взело, продължава да работи след прилагането му в действителността.

Ако дадена машина продължи да работи - съгласно разбирането за "работи"; напр. сърцето й да бие [т.е. тактовите й генератори да работят - поетичен израз от Юнашкото наречие] - за еди-каква си продължителност след извършване на еди-какво си действие, то действието й е било "правилно", т.е. тя е следвала закони, които не водят до повреда или "излизане от строя".

По-сложните управляващи устройства (виж "Схващане за всеобщата предопределеност": http://eim.hit.bg/razum) имат по-голямо пространство на правилните решения; имат по-голяма "свобода", т.е. възможности за бъдещо действие, след което да продължат да работят правилно.

Нищо не е "безсмислено", колеги...

Винаги можеш да извлечеш смисъл, т.е. ВРЪЗКА от едно "нещо" към друго "нещо". Смисълът е ВРЪЗКА между "неща". Най- лесно се пречертава вече известна връзка, поради което първоначалната нагласа при възприемане на "безсмислен" израз е да се провери: съществуват ли предварително изчислени връзки - смисъл - с дадения израз. Ако съществуват, тези връзки се виждат като "сиви линии". Когато човек види сива линия върху бял лист и има черен молив в ръка (да речем "шест пъти бе") и му заръчаме да начертае линия по първия начин, който му хрумне, най-вероятното му действие ще е да потъмни сивата линия.

Така направи измисленият "колега" по-горе: той "пречерта" връзката към смисъла "времето лети" и отхвърли възможността "time flies" да има приложения, които все още са неизвестни за неговата съвкупност от знания и трябват тепърва да бъдат пресметнати и "начертани" в паметта му.

. . . . .

Нека за забавление разгледаме израза "time flies" в друг случай.

Да си представим едно тригодишно детенце англичанче - Джони - което знае че "fly" е муха /едно такова мъничко черничко дето жужи и хвърчи; и като ти кацне на лицето те гъделичка и ти се опитваш да го изгониш, като махаш с ръце.../; Джони знае как се образува множественото число на муха - "flies"; Джони не знае обаче, че "fly" значи полет; за Джони "time" означава "часовник". Джони знае, че "clock" и "watch" също означава часовник: едно такова кръгло, дето има едни дълги, дето се въртят; тънките дълги се въртят бързо, а по-дебелите - много бавно; дебелите понякога даже изобщо не се въртят, а като си поиграеш с количките и после ги погледнеш - изглеждат по различен начин...

Знае какво е "watch" и "clock", но винаги, когато околните му хора са си говорили за време, то е виждало часовници. Джони е чувал баща си да казва: "Нямаме време. Трябва да побързаме" и когато го е казвал, бащата е поглеждал часовника си. Така у тригодишния Джони представата "време" се е свързала с представата "часовник" и когато той чуе "време", се сеща за "часовник".

Да си представим, че си слагаме голям и пъстър часовник на ръката и отиваме да си играем с това дете на детската площадка. / То няма часовник./

Какво ще направи Джони, ако изведнъж му кажем: "Time flies!"

Прозорлив колега: Най-вероятно ще погледне към пъстрия часовник и ще потърси мухи около него...

Именно! А какво ще направи, ако нямаме часовник?

Прозорлив: Може би ще погледне към ръката ни и да потърси часовник, около който летят мухи... Джони знае, че часовникът на баща му - предметът, с който свързва "time" - се намира на лявата му китка. Ако не е запомнило "ляво" и "дясно", ще го потърси и на двете ръце.

Какво си е помислил Джони, след като търси часовник и мухи?

Прозорлив: В ума му са се върнали образи, които свързва с "време" и с "мухи"... След като се появят тези мисли, Джони търси тяхно проявление, достъпно през входните му устройства: сетивата. Конкретният начин, по който търси, зависи от подробностите на средата.

Машината има нужда от среда, в която допълнително да търси смисъл: СЪВПАДЕНИЯ на образи, имена, особености, съчетания.

А какво ще направи Джони, след като открие, че около часовника няма мухи, или дори нямаме часовник?

Прозорлив: Зависи от състоянието на ума му и от поведенческия модел, който в момента, в който се случва тази случка, е избрал. Джони може да запомни израза "time flies" като представа, която означава това, което му е хрумнало веднага: "мухи около часовник" и да не предприеме нищо; да чака да срещне употреба на "time flies" в по-богата откъм подробности среда, така че да може да извлече и потвърди смисъла - ПОДРОБНОСТИТЕ, уточненията; силите, които намаляват пространството на търсене.

Може да не си направи никакъв извод. Да възприеме израза като безсмислица и да го подмине. Да не го запомни.

Джони може и веднага да ни попита:

- Какво значи "time flies"?

Така трябва да може да прави и машината, която - подобно на тригодишния Джони - ще се нуждае и от наставници и учители, докато се развива.

От това какво ще му отговорим ние и какво доверие има то към значенията, които му разясняваме, зависи какъв смисъл ще научи детето: по какъв начин ще ограничи пространството на търсене; или как ще разшири пространството на търсене, като добави възможност, за която не е подозирало.

Ако обясним на Джони, че "time flies" значи "времето никога не стига", то може да го запомни като цяло изречение: устойчива поредица от думи, към която "time flies" само препраща; т.е. когато Джони пак възприеме "time flies", той ще се сеща направо за "времето никога не стига" и ще търси смисъл в него, като срещата на "time flies" ще служи като преход при проверка на верността на условие в предписание за изчислителна машина.

Можем да обясним на Джони, че "flies" значи лети, без да разясняваме отвлечения смисъл на "време": отношение на последователност събития - преди, след, заедно. Тогава Джони може да продължи да свързва "time" с "часовник" и да започне да си представя "time flies" като "часовникът лети". Възможно е в мига, в който му го казваме, да затърси с поглед часовник, който да хвърчи около нас, в търсене на проявление (входни данни), което да затвърди образуваната връзка; или пък просто когато чуе "time flies" ще си представя летящ часовник и ще си мисли, замечтан: "Дали летящите часовници имат крила?"

"Ще си представя" е ключова част на изречението. Когато търсим смисъл, трябва да можем да си представяме. Това означава един вид възприятия да пораждат друг вид; единият вид може да е "действителен", т.е. възприет от входен канал, който се смята за "първичен"; свързан с "действителността", а другият: вторичен - породен от въображението.

Можем да кажем нещо и в този смисъл. Човек обикновено смята за "реални" входни канали зрението, слуха, осезанието, вкуса, мириса; когато през тях възприема данни с максимален обем.

Зрението е първичен входен канал, когато с него възприемаме изображения, в които можем да различим точки. Буквите, цифрите и препинателните знаци се възприемат през вторичен входен канал, защото от първичния канал - зрението, което вижда изображения с максимална разделителна способност, описващи се точка по точка, като всяка точка може да получава стойност за "цвят" и "яркост", които не са обвързани със съседните - се извличат данни с по-малък обем: букви, цифри, геометрични фигури.

....
--- КРАЙ НА ЦИТАТА ---

"Интересно беше едно приложение за изчислителен хумор, адрес към което не поствам само защото не може да се тества от страницата на проекта. Става дума за автоматично съставяне/интерпретиране на акроними. Проектът се казва Ha-Ha (сериозно)"


Част от Програмата ми за изследване е построяване на "творци", въз основа на разбраното за начина по който аз самият творя:
как се търсят думи, за да се сглобят изречения (построяване на изречения частица по частица, не пряко чрез думи, а чрез по-сложни и заобиколни структури, от които се извеждат думи).

Как се свързват изречения и смисли в словестни творби - от най-късите жанрове като хайку и отделни изречения, породени от някакво непосредствено възприятие, през текстове на песни, лирични разкази...:

Това е откъс от лиричен разказ:

"...Присъдата ми е доживотна, при строг тъмничен режим, и нямам право на свиждане. Единствено безсмъртната Надежда успява да се промъкне през тесните цепнатини между непробиваемите плътни черни ледени блокове на Отчаянието. Тя идва при мен когато съм най-тъжен и започва да ме увещава да избягам с нея; влиза неочаквано в килията ми и ме упоява с мечти. Сваля оковите ми, докато съм унесен, и ме пренася в Стаята за въжделения. Там ме завързва за Стола на илюзиите и ме измъчва с вяра в любовта."

обикновени разкази и до най-големите и сложни: художествени и "художественонаучни" романи, и философия. Как се преценява (как би могло да се преценява, така че резултатът да е правдоподобен на резултата при преценяване от някой човек), че текстът е "художествен", "реалистичен", "смешен" и т.н.; защо в някой случай някой определя нещо като "по-реалистично" от друго, или с по-добър стил и пр.

Започнах този "голям абзац", защото смешното е част от Плана (правил съм такива опити отдавна, но много кратки и все още без добра формализация; има във фантазията на име "Вселена и разум 4"). Много от похватите за създаване на смях са очевидни - проблемът е да се опишат в подходящи структури, така че да могат да се използват от машина без човешка намеса.

За илюстрация на това колко са очевидни някои "смехопородителни" похвати. В "Шоуто на Слави", където "бълват" формалистични смешки, ги използват.

Например:

-- Език богат на определения, изпълващи задъханата от ежедневните тревоги душа на обикновения човек със свеж въздух, ухаещ на приятни мисли и добро настроение.

-- Включване на много фактологични подробности, свързани с текущи събития и образи, построени по-рано от разказвача в други разкази; съчетаване на несъвместими (невероятни, разминаващи се във времето) събития; използване на клишета (това е много смешно); много връзки между частите - така се създава реалистично звучене и се увлича слушателят. Оригиналничене с многозначни недоизказани изрази....

Импровизация:

Пешо Мълдъров Скълиев, тракторист от ТКЗС-то в село Мало Големово, община Перник, окръг София, се люлееше в мрака по пътя от кръчмата на местния чорбаджия Марко Винарски към дома, където до мивката го чакаше вярната му съпруга Кръшка Скълиева, която поради вечните му запои се бе принудила да повика водопроводчик да я оправи.

Клатше се Пешо по пътя, клатеше се, и тъкмо когато щеше да се подхлъзне на една кравешка фъшкия и да падне до телефонния стълб, на който се блещеше некрологът на дядо Мълдьо Скълиев, бащата на Пешо - преди два дена му направиха помена за 40 дни, - когато върху калния селски път от небето се спусна ярък светлинен лъч. По-ярък даже от фаровете на комбайна "Нива" на окъснелия съселянин и комбайнероинтелигент Слави преди три дни, миг преди да ги загаси, защото вместо да вършее житото вършеше една тънка частна незаконна работа на задната седалка, и се страхуваше от народната власт, кметицата леля Стефка Малоголемова, майка на неговата бизнеспартньорка.

Следва продължение...        


--- "Оригинални" имена, които описват носителите им, "мръсни думи" и насърчаване на "мръсно подсъзнание" - "мръсотиите", изказани по телевизията са много смешни, защото в повечето предавания не се говори така, това е "оригинално" - прикрити зад "оригинални" имена, в които се съдържа "мръсния" смехопораждащ корен в основна форма или с някой сменен звук. "По-оригинални имена" са такива, които се срещат по-рядко отколкото други, които са по-"обикновени".

Например:

Мила, моят приятел Курти влезе. Чукохвъргачката Лиза Мишпека постави световен рекорд. Несетилият женска ласка Сам Шепърд пристъпи към жрицата на любовта. Чикистът Хулио Педро Педраса де Лакоруня вдигна високо своята бунтовническа пушка, по чийто дървен приклад се белееха резки от много успешни попадения в целта. Попфолкпевицата Радка Пираткова дойде с бял Мерцедес....

.....


Подробно изследване, описание и подплътяване с голямо количество примери за похватите при съставяне на словесни творби, съчетано с построяване на структури и математически модели на разбраното, и моделиране на налучканите механизми за построяване на словесни творби, е "използване на изкуство в изчислителното езикознание".

Поздрави.


[This message has been edited by Tosh (edited 23-04-2005).]
Активен
Творчество и изследвания:
http://twenkid.com
http://artificial-mind.blogspot.com

artanis

  • Неактивен Неактивен
  • Публикации: 589
    • http://free.hit.bg/artanis
изчислителна лингвистика
« Отговор #44 -: 24.04.2005, 12:53:00 »

Tosh,

Първо ще те помоля да пишеш по-кратки постове. После - идеята ти е интересна. Ако я формализираш още малко, от това би излезнала добра докторска теза. Познавам хора тук, които биха ти обърнали внимание. Те се опитват да комбинират изчислителна лингвистика (изчислително езикознание), философия, когнитивни науки (и т.н.)

Но откакто Чомски прави заключението, че за разпознаване на естествен език ни трябва машина на Тюринг е минало доста време. От тогава хората се опитват да използват по-прости модели за практически задачи (като например spell checking) Вероятно ще ти се стори интересна литературата по темата от 70те години.

За 'времето лети' провери какъв е предметът на корпусната лингвистика.

В качеството ми на докторант по когнитивни науки, бих искал да ти кажа, че когнитивните психолози не се интересуват от програми, които не грешат. По-интересни са им програми, чиито грешки наподобяват човешките. Опитай се в този контекст да интерпретираш чата с Jabberwock.

За представителната извадка. Поставих израза в кавички, защото не разбирам точно какво искаш да кажеш. Но мога да ти дам пример за един добър парсер на естествен език. Той е разработен от финландската компания Коннексор. Имат много клиенти - институти за ресърч, а самият парсер е най-доброто, което се предлага в момента: http://www.connexor.com/

с поздрав:
а.

[This message has been edited by artanis (edited 24-04-2005).]
Активен

Tosh

  • Неактивен Неактивен
  • Публикации: 249
  • Filmmaker
    • Изследванията на Тодор Арнаудов
изчислителна лингвистика
« Отговор #45 -: 26.04.2005, 00:26:00 »

Здравей.


"После - идеята ти е интересна. Ако я формализираш още малко, от това би излезнала добра докторска теза. Познавам хора тук, които биха ти обърнали внимание.
Те се опитват да комбинират изчислителна лингвистика (изчислително езикознание), философия, когнитивни науки (и т.н.)"

Интересно...

"В качеството ми на докторант по когнитивни науки, бих искал да ти кажа, че когнитивните психолози не се интересуват от програми, които не грешат. По-интересни са им програми, чиито грешки наподобяват човешките. Опитай се в този контекст да интерпретираш чата с Jabberwock."


В диалога, който цитирам, не виждам Jabber да допуска грешки, подобни на човешките... Не мисля, че човешката "познавателна сила" е в допускането на грешки; грешките са страничен ефект на търсенето - според мен е важно "мислещата машина" да показва че търси познание и да напредва докато търси. Грешките би трябвало да водят до напредък и до постигане на познание - ако не водят до никъде, не виждам полза да бъдат целенасочено допускани.


"За 'времето лети' провери какъв е предметът на корпусната лингвистика."

Изследване на сбирки от текстове. Използват се статистически методи? Не схващам връзката?

Между другото, спомням си че през 2003 г. имаше среща на клуб "Джон Атансов", където ти и едно момиче, на което забравих името, разказвахте за използването на корпуси и стистически методи. Тя работеше върху откриване на имена, а ако не се лъжа, ти ни спомена за това че не са разработени синтактични анализатори за български, и че имаш за цел да построиш такъв. Правилно ли си спомням? Как се развиха нещата?

"Но откакто Чомски прави заключението, че за разпознаване на естествен език ни трябва машина на Тюринг е минало доста време. От тогава хората се опитват да използват по-прости модели за практически задачи (като например spell checking)"

Проверка на правописа е полезна задача, но скучна. :-(
Мен лично ме вълнуват по-смели и забавни - Мислеща машина. Общата задача ще реши всички частни случаи.

Между другото, в изчислителното езикознание някой прилагал ли е методи със самомодифициращи се кибернетични структури? Кибернетични т.е. в които има целенасочено поведение (с цел например да се построяват граматически правилни изречения) и управление, права и обратна връзка (грешките трябва да се поправят) и приспособяване на начина на работа така че да е оптимален спрямо входните данни (средата) и целта на съществуването на системата (нейните подсистеми).

Знаеш ли за използване на строги или нестроги клетъчни автомати за обработка на естествени езици? Под "нестроги" имам предвид които не са длъжни да са еднородни - може да има повече от един вид автомати, които да работят в едно поле, могат да имат памет, която да не е достъпна за съседните автомати; може да има влияние на клетъчен автомат не само върху съседните му, но и върху отдалечени и "специални" автомати, които служат например като изходи за извеждане на данни.

Това също е "изкуство", защото е трудно всичко да се обоснове строго и подробно - става много сложно и необозримо.


Поздрави.
Активен
Творчество и изследвания:
http://twenkid.com
http://artificial-mind.blogspot.com

metashnisher

  • Гост
изчислителна лингвистика
« Отговор #46 -: 26.04.2005, 08:29:00 »

quote:
Originally posted by Tosh:

Проверка на правописа е полезна задача, но скучна. :-(
Мен лично ме вълнуват по-смели и забавни - Мислеща машина. Общата задача ще реши всички частни случаи.



В никакъв случай не давайте на машините да мислят!! Не сте ли чели Азимов?
Активен

artanis

  • Неактивен Неактивен
  • Публикации: 589
    • http://free.hit.bg/artanis
изчислителна лингвистика
« Отговор #47 -: 28.04.2005, 20:17:00 »

Здрасти Tosh,

Първо за грешките. Jabber не е добър пример. (Въпреки това, помисли си как би отговарял на твоите умни въпроси един пиян или отегчен човек) Доколкото си спомням точно на един от първите тестове на Тюринг са познали машината, защото веднага е познала колко прави 249 844 * 4426 (примерно). Грешките на хората (с някакво увреждане на мозъка след травма и др.) са много важни в когнитивните науки, защото помагат да се направи сравнително (не)точно предположение за структурата на човешкия мозък (най-практическото приложение на всичко това е да се лекуват гореспоменатите увреждания). За да бъде разработен някакъв математически модел, той трябва да бъде тестван. Тук на помощ идва изкуствения интелект. Ето защо грешките са важни, ако наподобяват човешките...

За корпусната лингвистика. Провери в темата SAX - една чудесна технология. Там дадох на Phyz един линк към встъпителна лекция. Статистическите методи за които говориш са много полезни, защото с тяхна помощ се извлича информация за структурата на езика (включително на ниво части на речта, синтактична, семантична, което е в основата на разрешаването на многозначности) Освен това ако отричаш корпусната лингвистика, отричаш цяло едно направление от философията (видам, че имаш афинитет към нея)

За парсера - нещата се развиха добре   Парсерът работи, но не се справя много добре, защото липсват различни ресурси, които някой трябва да създаде (и друг някой да им плати) По принцип се занимавам с него в свободното време, ама Италианците ми плащат да анализирам италиански, а не български. Съжалявам.

За мислещата машина - ако започнеш да работиш по създаването на такава машина, ще стигнеш до заключението, че това е една невъзможна задача (или поне много трудна) Опитай се да намериш някакви по-актуални статии по темата. Междувременно можеш да тестваш системата 20q (ако си любопитен) системата претендира, че може да познае за какво си мислиш. Използва невронна мрежа. http://y.20q.net/anon

Това за кибернетичните структури и автоматите за изход не го разбрах съвсем. Предполагам, че говориш за генетичните алгоритми. Те се използват често в изкуствения интелект както и невронните мрежи. Приликата им е, че и двата метода са бедни на знание.

За клетъчните автомати не те разбирам напълно, но не знам за някой в България, който да ги е създал. Ако се интересуваш, има доста литература за автоматите (не и в библиотеката на ФМИ, но това е друг въпрос)

За изкуството: По-внимателно в тази област, защото ако пробваш в когнитивните науки и вероятно във философията, никой няма да те вземе насериозно. Интересно би било, ако можеш да разработиш модели на начинът по който човек твори.

Друг е въпросът ако искаш да пишеш. Тогава вече трябва да си помислиш дали някой ще купува романите ти (в България е доста трудно да пишеш) А ми се струва загуба на време (и потенциал) да ги пишеш само за да ги публикуваш в геоситис.

Извинявам се за закъснението на отговора, както и за възможните неясности (глупости), които съм писал по-горе. Доста съм натоварен напоследък, но ще се опитам да ти отговарям (ако отговорите ми имат някакво значение за теб), защото виждам, че имаш желание да се развиваш и си уверен във възгледите си.

чао за сега
а.

[This message has been edited by artanis (edited 28-04-2005).]
Активен

TeeRexX

  • Неактивен Неактивен
  • Публикации: 739
  • изпратете ми анонимно пари в плик :)
    • www.myspace.com/teerexx
изчислителна лингвистика
« Отговор #48 -: 28.04.2005, 22:00:00 »

г-н Чанев,
Впечатлен съм от "мислещият сайт" който се публикувал! Браво на хората, които са го създали.
Активен

Tosh

  • Неактивен Неактивен
  • Публикации: 249
  • Filmmaker
    • Изследванията на Тодор Арнаудов
изчислителна лингвистика
« Отговор #49 -: 30.04.2005, 16:24:00 »

Здравей.

За грешките: С предположения за начина на работа на мозъка въз основа на грешките му при "повреди" съм съгласен, с изключение на това че не виждам къде тези знания могат да помогнат за лечение на хората, допускащи тези грешки (можеш ли да ми дадеш някакъв пример?). Например за изследване на работата на мозъка са полезни наблюденията на поведението при загуби на полукълбо, при дислексия (някои го броят за болест), при "савантизъм" ("гении идиоти" които помнят почти всичко, защото умовете им не могат да преценят кое е по-важно; някои нямат две полукълба на мозъка, нямат мазолесто тяло, а само едно "кълбо"), но не знам как биха могли да се лекуват тези увреждания.

За корпусната лингвистика: Не я отричам. За пръв път май че през миналия век бях чел някъде за руски езиковед, който записвал на магнетофон цялата реч, което детето му чува. Интересуват ме такива дневници, описващи развитието на речта на деца от първите думи до изреченията и текстовете. От тогава се надявам да попадна на такава книга, но не се е случвало.

Не разбрах обаче каква връзка откриваш между моя пример за "Времето лети" и корпусната лингвистика - виждам моя опит повече като аналитично-синтетичен, отколкото като емпиричен. //Или имаш предвид именно, че е аналитична?/

"За мислещата машина - ако започнеш да работиш по създаването на такава машина, ще стигнеш до заключението, че това е една невъзможна задача (или поне много трудна)"

Трудна е, затова е вълнуваща и дава възможност за фантазии... Че е невъзможна обаче, според мен не отговаря на опитните данни: човекът е мислеща машина. Под "машина" разбирам "абстрактно управляващо изчислително устройство".

"Междувременно можеш да тестваш системата 20q (ако си любопитен) системата претендира, че може да познае за какво си мислиш. Използва невронна мрежа. http://y.20q.net/anon

Леле, много е умна - знае какво да пита! :-)


"За изкуството: По-внимателно в тази област, защото ако пробваш в когнитивните науки и вероятно във философията, никой няма да те вземе насериозно."

Във философията (метафизика, аналитична философия (логика), екзистенциализъм) вече съм "ветеран". Поне един признат български философ, Ангел Грънчаров, ме взе доста насериозно още преди 3 години:  http://www.geocities.com/eimworld/eim18/predopredelenost2.htm

За учените - знам че без красноречиви резултати няма смисъл да се показваш пред тях.
Имам обаче и личен опит, с човек който определено беше учен (специализирала биохимия на мозъка (аспирантура), 26-годишна тогава, програмира от детска възраст на машинни езици, занимава се с електроника на инженерно ниво (FPGA)), и уж не взимаше насериозно моите "детски фантазии" и мисловни "конструкции, нямащи нищо общо с реалността", но всъщност ме взимаше по-насериозно, отколкото аз самият се взимам - тя ме намери, за да ми каже че съм фантазьор, а не аз нея, и доста упорито ме навиваше да се занимавм с нейната наука: мозъци, биохимия, биохимия на мозъка, микроконтролери, предаване на данни чрез ЕЕГ, VHDL и FPGA, за да мина от своето към нейното течение на търсене.


"Това за кибернетичните структури и автоматите за изход не го разбрах съвсем."

Някои от клетъчните автомати биха служили на системата за общуване - за четене на данни и за извеждане на резултати.

"Предполагам, че говориш за генетичните алгоритми. Те се използват често в изкуствения интелект както и невронните мрежи. Приликата им е, че и двата метода са бедни на знание."

Имам предвид еволюционни алгоритми ("зародиши на разум"), но не точно генетични алгоритми - според мен те са прекалено ненасочени и тежки.
Питам (и предполагам че отговорът е "не") за самоорганизиращи се системи, обработващи език (по-точно изкуствен разум, който се проявява и чрез език), чието развитие прилича на развитието на живите организми в онтогенезата (развитието на индивида).
В началото има зародиш, в който "пише" как да се построи системата от "строителен материал", а не каква е зрялата система.
При подходящи условия - среда, входни данни, (температура, определени вещества в определени количества на определени места, общуване, обучение, взаимодействие с достатъчно сложна среда) - от този зародиш постепенно израства цял организъм, който използва сложността на средата за "дописване на кода си" и за "оцветяване" на "рисунката с молив", която се съхранява в зародиша.


"За клетъчните автомати не те разбирам напълно, но не знам за някой в България, който да ги е създал. Ако се интересуваш, има доста литература за автоматите (не и в библиотеката на ФМИ, но това е друг въпрос)"


"Нееднородните клетъчни автомати" (всъщност това което имам предвид не са точно клетъчни автомати (cellular automata) в смисъла на Фон Нойман и Уолфрам, а са по-сложни) са начин за построяване на системи, с който смятам да да си играя.

"Друг е въпросът ако искаш да пишеш. Тогава вече трябва да си помислиш дали някой ще купува романите ти (в България е доста трудно да пишеш) А ми се струва загуба на време (и потенциал) да ги пишеш само за да ги публикуваш в геоситис."

Знам че в България няма пазар за проза, още по-малко пък за толкова философска, странна и сложна като тази, която на мен обикновено ми се пише. Нито пък пиша, само за да публикувам някъде под земята (и на sf.ludost.net :-). Когато писач пише, го прави защото му се пише - писането му е забавно, има сюжет, вдъхновение, желание, време; и няма нещо по-интересно за правене в същото време... "Едрогабаритната" ми проза освен това в голямата си част всъщност е философия, написана като проза.

И не съм съгласен, че писането (и подобряването на написаното) е загуба на време - упражнява въображението, дава възможност на човек да вижда защо пише така, както пише, и разбира че писането - творчеството - не е "магия", а може да се обясни. Подобрява се и усета към езика и думите, към откриването на това кога дадена откъс от текст звучи "добре", и защо така написан звучи по-добре, отколкото ако еди-коя си дума е сменена с друга, или пък словореда е променен еди-как си.

За закъснения на отговорите - няма проблеми, и аз не мога много бързо. Благоадаря ти за желанието да обменяме мисли.


Поздрави.

[This message has been edited by Tosh (edited 30-04-2005).]
Активен
Творчество и изследвания:
http://twenkid.com
http://artificial-mind.blogspot.com

artanis

  • Неактивен Неактивен
  • Публикации: 589
    • http://free.hit.bg/artanis
изчислителна лингвистика
« Отговор #50 -: 07.05.2005, 17:44:41 »

Здрасти Tosh,

Извънредно включване :)

Какво мислиш за формалната онтология на Nicola Guarino? http://www.loa-cnr.it Ако наистина си ветеран във философията, би трябвало да си запознат с работата му.

Аз, лично (а и не само аз) подхождам малко скептично, защото ако си компилираш онтология, няма как да разбереш дали си прав или грешиш. Можеш да вярваш, че онтологията ти правилно представя знанието. Или да кажеш просто: хората правят така. Но не и да знаеш със сигурност.

Нещо май не ме кефи, честно.

поздрави
Активен

Tosh

  • Неактивен Неактивен
  • Публикации: 249
  • Filmmaker
    • Изследванията на Тодор Арнаудов
изчислителна лингвистика
« Отговор #51 -: 08.05.2005, 14:28:59 »

Здр.

"Какво мислиш за формалната онтология на Nicola Guarino?"

Нищо.


"Ако наистина си ветеран във философията, би трябвало да си запознат с работата му."

Ще използвам изречението за анализ на похват, който би могъл да се използва при построяването му.

1. Как стигна до това манипулативно заключение? :-)

Предвид това че си в Италия, изречението ми звучи като "Петьо, ако наистина си ветеран във футбола, би трябвало да си играл с Кастел ди Сангро. [Защото ако не си, значи само се надуваш, и ще ти се присмея, а аз знам че ти си опитен футболист, но мразиш да те бъзикат."]

Или когато мъж казва на жена, или жена на мъж: "Ако наистина ме обичаш, би трябвало да направиш това нещо, което не искаш да направиш, което ти казвам.  [Защото ако не го направиш, ще те изоставя; а аз знам, че си луд/а по мен, и ти го казвам тъкмо защото знам, че си; и искам да направиш това, което ти казвам да направиш.]"

Или пък аз да кажа на някой опитен 35-годишен програмист: "Ако наистина си опитен програмист, би трябвало да си програмирал откриване и разпознаване на почтипериодични функции в зададена честотна област, изчисляване на плавни преходи между периодични функции и промяна на честотните характеристики на звук, без промяна във времетраенето му. [Защото аз съм правил това, когато бях на 19, и ще си кажа: леле, ти изобщо не си опитен програмист, ако не си го правил!]."


Следствието в горните примери не идва от предпоставката, написана в изречението - видимата предпоставка, която изказващият смята че слушателят приема за истина, - а от скрита измислена предпоставка, която би трябвало да предизвика някакво целево поведение, и която се опитва да вмъкне смисъла на някаква дума или изречение в калъп, който е подходящ за целта.

 
2. Казах, че съм ""ветеран"" във философията, а не "ветеран" (кавичките са универсално средство за указване на значение, което не е точно като това в речниците, и игра на думи). Затова посочих какво разбирам под "ветеран" в метафизиката, аналитичната философия и екзистенциализма: http://geocities.com/eimworld/eim18/predopredelenost2.htm (най-голямата ми битка)
Всъщност по-точно: http://geocities.com/eimworld/razum

Построяване на философия: писане, измисляне, фантазиране, противопоставяне - философстване.
Под "ветеран във философията" разбирам "войник с боен опит",  "деятел".

....

"Аз, лично (а и не само аз) подхождам малко скептично, защото ако си компилираш онтология, няма как да разбереш дали си прав или грешиш. Можеш да вярваш, че онтологията ти правилно представя знанието. Или да кажеш просто: хората правят така. Но не и да знаеш със сигурност."


А ако не си съставиш онтология, значи знаеш, че твоята онтология - която не си съставил - е правилна, и с нея можеш да правиш машини? :-о

Знаем, че "всяка формална система е непълна" - и също че математиката нищо не доказва! Който не знае - Гьодел доказа, че математиката нищо не доказва. Лъжат ви като ви казват, че "математиката работи само с неоспорими истини" - няма формална система с неоспорими истини, аксиомите "падат от небето" (с което някои не са съгласни, но така казват много учени...).

Какво знаеш със сигурност? :-)

Знаеш ли -- със сигурност!!! Трябва да го докажеш математически!!! Въпреки че всъщност, както знаем, всяка формална система е непълна, и математиката "нищо не доказва" ("точно колкото например Библията или Корана") -- че за да събере две числа, мозъкът първо не ги умножава с 32356778, събира резултата, и после го дели (това го прави подсъзнателно - съзнанието разбира само сбора)? (Да! Сигурно затова е толкова бавен, а не защото има слаба и ограничена памет и не може да помни междините резултати) Или защо не умножава събираемите с 4549854 или с 823293 или с 4645646 или с 34545464785343.459440435454? Той има петабитове памет и извършва квинтильони операции в секунда, колко му е да направи такива прости сметки, за да събере две числа, нищо че няма разумни основания да прави така?

Сигурен ли си, че когато поискаш да отпиеш глътка от питието си, като за целта е необходимо да вземеш чашата, която се намира на "една ръка разстояние", първата мисъл на мозъка не е да станеш, да направиш една обиколка на стаята (или по-добре три - за щастие), да се завъртиш три пъти на надясно, да скочиш седем пъти на левия крак, да клекнеш, да си пипнеш носа с кутрето на лявата ръка, да се почешеш зад дясното ухо с нокътя на безимения пръст на дясната ръка, да се приближиш до чашата с патешко ходене, да се изплезиш, да се изправиш, да плеснеш с ръце на нивото на гърдите, да се поклониш; да погледнеш към тавана; да хванеш чашата, да направиш шест обиколки на стаята (защото две по три на квадрат - 30 + 24 - 12*(42480246/21240123) = 6) с нея, да я прехвърлиш от едната ръка в другата и обратно, за време 25 удара на сърцето, и след това да отпиеш глътка, да направиш 9 обиколки на стаята......... и чак тогава да я оставиш на масата?

Можеш ли да докажеш, че мозъкът не си помисля точно това, което ти казвам, в началото, но след много преобразования, въз основа на "истинското" представяне на знанията, постепенно да се отказва от обиколката на стаята, скоковете, клякането, почесванията и т.н., докато стигне до посягане, поднасяне към устата, отпиване, и след това оставяне на чашата без излишни движения?

Можеш само да вярваш, че мозъкът не е толкова глупав, или да кажеш просто: "хората не правят така" или "такива глупости не могат да ми минат през ума, те не допринасят за постигане на целта и са излишни!". Излишни са според твоята онтология - не знаеш, дали онтологията на мозъка - която ти не можеш да съзнаеш, нито да разбереш - не е точно такава, или пък някаква друга, за която дори не си помисляш.
...
Тош
Активен
Творчество и изследвания:
http://twenkid.com
http://artificial-mind.blogspot.com

artanis

  • Неактивен Неактивен
  • Публикации: 589
    • http://free.hit.bg/artanis
изчислителна лингвистика
« Отговор #52 -: 08.05.2005, 14:40:13 »

:)
Активен

artanis

  • Неактивен Неактивен
  • Публикации: 589
    • http://free.hit.bg/artanis
изчислителна лингвистика
« Отговор #53 -: 09.05.2005, 18:49:42 »

Здрасти,

Тук много ми шумят нещо и реших че времето е подходящо за писане на постове.

Ще започна с когнитнивните науки. Има няколко вида дислексия, като причините за проявяването на този феномен не са съвсем ясни. Например Карамаца (един от водещите учени в тази област - от Харвард, нищо че е италианец) успява да докаже (чрез липса на противоречие с данните, събрани от пациенти), че вероятно има значение дали обектите, които се съхраняват в паметта на човека са животни или неодушевени предмети (и вероятно храни). Така например при възприятието пациените не са могли да познаят само животни, или звукове на животни. При осъществяването на реч или писане, субектите не могат да се сетят точно за животни. Изводът е, че животните и другите обекти се съхраняват на различни 'места' в математическия модел на човешката памет, което предполага, че е възможно да се съхраняват и на различни места във физическия мозък. Би било възможно, ако тези места се изолират, да се лекуват.
(Не знам точно как биха могли да се лекуват, но ако клонирането е възможно и се практикува, предполагам, че и нещо такова би могло да се практикува, но не съм специалист)

Когнитивните Науки са нова и доста интересна дисциплина. По една случайност италианците са сред най-добрите експериментални психолози (във водещите Американски Университети и Падова, Италия)

Корпусната лингвистика е точно емпирична. Предлагам ти да прочетеш лекцията, преди да обсъждаме нещо повече за нея. Тя съвсем не се ограничава във First Language Acquisition. Между другото Чомски отрича корпусната линвистика.

За човекът, че е мислеща машина... Ами не знам. Предполагам, че в един възможен свят човекът е мислеща машина.

За невронната мрежа. Какво и е умното, проста невронна мрежа. Чиста статистика :) (+ математически модел)

За взимането на сериозно имам пред вид някой да инвестира пари в теб.

За българските учени (в България) :) Айде да не започваме. Ама има и такива, които работят (в тези нечовешки и дискриминиращи условия)

За зародишите на разум не те разбирам. Освен, че от това би излезнала интересна книга, съветвам те да провериш някой дали го е правил преди теб и какви са неговите резултати. В общността на учените всички се познават (Щатите, Европа, Австралия, Япония, Израел .... а къде другаде се прави наука?)

За прозата която пишеш: философска, странна и сложна. Остави читателите да решат. Значи изобщо за писането аз не съм компетентен и вероятно не мога да ти кажа нищо за което вече да не знаеш.

За последния ми пост. Да, признавам, че беше малко провокативен, но този човек е доста известен в Европа и Щатите, въпреки че американците май не го харесват много. Не е някакво местно явление. Освен това се опитва да използва философски концепции за практични неща. Въпреки това ми се струва, че тези приложни онтологии си остават една красива Европейска идея с която не можеш да отидеш до магазина и да си купиш хляб (ама и тук пак зависи, защото в Европа има механизми на финансиране за такива идеи .. вероятно защото са европейски)

Тук стана малко по тихо и ще се опитам да поработя малко.

Сърдечни поздрави:
А.
Активен

Tosh

  • Неактивен Неактивен
  • Публикации: 249
  • Filmmaker
    • Изследванията на Тодор Арнаудов
Re: изчислителна лингвистика
« Отговор #54 -: 18.05.2005, 22:54:04 »

Здрасти.

"Тук много ми шумят нещо и реших че времето е подходящо за писане на постове."

:)


Цитирам те, защото е минало много време от съобщението, и може да си забравил. Стана дълго - такъв ми е стилът; подробен...


"Ще започна с когнитнивните науки. Има няколко вида дислексия, като причините за проявяването на този феномен не са съвсем ясни. Например Карамаца (един от водещите учени в тази област - от Харвард, нищо че е италианец) успява да докаже (чрез липса на противоречие с данните, събрани от пациенти), че вероятно има значение дали обектите, които се съхраняват в паметта на човека са животни или неодушевени предмети (и вероятно храни)."
Така например при възприятието пациените не са могли да познаят само животни, или звукове на животни. При осъществяването на реч или писане, субектите не могат да се сетят точно за животни. Изводът е, че животните и другите обекти се съхраняват на различни 'места' в математическия модел на човешката памет, което предполага, че е възможно да се съхраняват и на различни места във физическия мозък. Би било възможно, ако тези места се изолират, да се лекуват."


Можеш да напишеш името му точно както се пише, и някъде има ли в Мрежата някаква работа? Така казано не ми става ясно какви опити са правили, и какво значи "звукове на животни".
Изследваните разпознавали ли са звукове на машини, или електронни (изчанчени) звуци, пускани докато се показва животно? или преправен човешки глас, който уж е издаден от животно? Или пък почти чисти тонове, приписвани на животни?
Правили ли са опит с нещо, което се държи като животно и прилича на животно, но не е животно, например герой от игра, или пък агент от рода на Кламера, Джина, Мерлин в Office?

Като казваш "животни и неодушевени", ще вмъкна: "животните" (хората) са "машини" в смисъла посочен по-долу.

Това по което се различават животните като нещо по-различно от "неодушевените" предмети, например от двегодишно дете като ги наблюдава и си играе с тях (а не е от професор по биология), не е че "животните са живи" (белтъци, мелтъци и т.н.), или пък че са "одушевени" (душата е невидима и неосезаема, за съжаление...), а е че мърдат, ходят, скачат, бягат; имат очи, нос, уста; ядат, пият; че мигат, че издават звуци (дори и без нещо да ги докосва, а особено ако са котки и им натискаш мекичкото на лапичките, или пък ги стиснеш в прегръдка), че бягат, ако ги гониш или ако им настъпиш опашката. Те взаимодействат с теб, отговарят на твоите действия с действия, и освен това не винаги можеш да предвидиш точното им следващо действие въз основа на предишните - поведението им е сложно и зависи и от фактори, които не можеш да разбереш само като ги наблюдаваш.

Мисълта ми е, че особеното не е "живо", а "променливо", "динамично", "взаимодействащо"; "достатъчно сложно"; с достатъчно много състояния, в които то хем си е същото нещо, но изглежда много по-различно, и частите му са в различно съотношение.Нормално е динамичните "неща", които взаимодействат и имат поведение,  да се помнят по различен начин (форматът на описание да бъде различен), отколкото статичните "неща", които се променят само ако нещо друго извърши промяната.


"което предполага, че е възможно да се съхраняват и на различни места във физическия мозък. Би било възможно, ако тези места се изолират, да се лекуват."

Ако мозъкът беше проектиран както трябва (чисто, модулно, ясно, несамообвързващо), можеше и да можеш да локализираш къде се помни нещо, само че принципът на мозъка (на невронните мрежи) е в това че те нямат обособена памет; тя се проявява като страничен ефект.


"(Не знам точно как биха могли да се лекуват, но ако клонирането е възможно и се практикува, предполагам, че и нещо такова би могло да се практикува, но не съм специалист)"

И аз не съм специалист по биохимия, само че клонирането е много по-просто отколкото да бърникаш в мозък и да оправиш нещо, което не знаеш как работи и не знаеш как е развалено. (Най-малко, не можеш да пъхнеш вътре "отвертки" и "поялници", и не знаеш каква е схемата).
Клонирането - взимаш едно ядро, слагаш го в друга клетка на която си махнал ядрото; превръщаш клетката със сменено ядро в зигота, вграждаш я някъде да расте и готово - може и да стане зряло същество. Работата ти е "взимаш, слагаш, пъхаш". Друго нещо е управляващо устройство (мозък).


"Корпусната лингвистика е точно емпирична. Предлагам ти да прочетеш лекцията, преди да обсъждаме нещо повече за нея. Тя съвсем не се ограничава във First Language Acquisition. Между другото Чомски отрича корпусната линвистика."

Прочетох лекцията (чак я забравих), но за да обсъждаме нещо конкретно ще трябва да прочета повече. Обичам емпирични методи. Мислещата машина ще използва "корпуси" (ще говори, ще чете, ще се учи от текст); езиковите машини, с които се каня да си играя - също ще използват съвкупности от текстове, и ще търсят зависимости в текстове.
Но --- анализът на текстовете --- според мен не е заложен само в текстовете. Текстовете от "жива реч" в повечето случаи съдържат много малка част от информацията, която е била част от мислите на тези, които са произвели този текст - "естественият" език не е взаимноеднозначно изображение на мисълта.

Когато човек изследва текст, в ума си се опитва да допълва липсващата информация, и да си мисли нещо, което би могли да доведе до извеждане на такава реч.



"За човекът, че е мислеща машина... Ами не знам. Предполагам, че в един възможен свят човекът е мислеща машина."

За "машина", в моята терминология, която все още се уточнява :), има такива приказки:

Машина -- динамична система, която може да извършва обратими повторими промени върху части от себе си чрез части от себе си.
По-висока разделителна способност и сложност на промените -- по-съвършена машина.

Човекът очевидно е "машина".


Откъс от разни работи:

--- Откъси ---
 Управление означава данни от паметта на едно УУ да се запишат в паметта на друго УУ по начина, по който първото устройство е очаквало, т.е. по начина, по който в паметта на първото устройство е било записано, че данните ще бъдат записани.
 Разделителна способност на управлението (РСУ) описва способността на управляващото устройство да извежда данни от своята памет (своята вселена) в паметта на по-нисшето управляващо устройство (майчината вселена), така че промените в майчината вселена да са по-близки до най-малките възможни промени в майчината вселена и да са по-близки до очакваното.
 Разделителна способност на възприятието (РСВ) показва какви особености от майчината вселена се възприемат (различават) от подчинената вселена, която е част от майчината.
 "Истинско" или "пълно" управление съществува само тогава, когато УУ въздейства върху подчиненото така, че при максималната възможна РСВ на разглеждане на подчиненото устройство, в паметта на главното УУ да са записани всички подробности, описващи състоянието на подчиненото, с вероятност за истинност единица.
 Пълното управление изключва грешки, тъй като при него управляващото устройства ръководи всички подробности и "знае" как да отвърне на всички възможни случаи; в този случай УУ определя кое е възможно и кое е невъзможно и не допуска поява на невъзможни случаи, тъй като не може да ги породи.

....

Когато човек пожелае да подхвърли монета и го направи, смята, че щом може да поиска да хвърли монета и го направи, то има свобода да го стори, защото е направил "каквото си иска"...

РСУ и РСВ в случая се описва с глаголи, съществителни имена, прилагателни, предлози и пр. части от езика на разумните същества. Езикът на разумните същества (естественият език) описва начин, по който човешкият разум възприема света. Този начин е ограничен от тесния изходен информационен канал (въобречка), достъпен за ползване от човека.

Езиковото описание дава чувство на свобода на човешкия разум да прави "каквото си иска" поради ниската си разделителна способност и ниския критерий за точността на изпълнение на това което "си иска".

Разделителната способност на възприятието и управлението в горния пример е глагол-съществително. "Управление" означава словосъчетанието [хвърлям монета] да се изпълни - човек да [хвърли монета].

В майчината, за човешкия разум, вселена обаче, разделителната способност е много по-висока, защото Вселената не е изградена от монети и хора, взаимодействията между които могат да се опише с незначителен брой езикови елементи от рода на:

Хвърлям монетата на пода.
Хвърлям монетата на масата.
Хвърлям монетата зад дивана.
Хвърлям монетата през прозореца.
Хвърлям монетата в тоалетната.
Хвърлям монетата в коридора.
и т.н.

--- Край ---

Човекът очевидно е управляващо устройство, и може да прави "каквото си иска", макар с ниска РСУ.
Изчислителните машини са машини и управляващи устройства в горните смисли, защото те обратимо и повторимо могат да променят паметта си - и съвършени УУ - това което искат, правят точно така, както го искат,
и това което искат е строго определено - могат да го сторят с максимална РСУ и РСВ на вселената, в която действат - тяхната памет.



"За невронната мрежа. Какво и е умното, проста невронна мрежа. Чиста статистика  (+ математически модел)"

А какво е човекът и всичко останало? Същото: някакви абсолютно елементарни и безмозъчни частици, които според някои правят точно това, което е предопределено (изобщо не са умни, "нямат избор"),
а според други някои от тях следват "чист вероятностен математически модел", и поведението им е "случайно", т.е. имат "свободна воля", т.е. пак нямат избор, защото и те самите не знаят точно какво кога ще направят, и защо.
Ако нещо не си избира, как може да е умно? То прави това, което е заложено в него, или пък прави случайни неща, т.е. изборът му не зависи от нищо, включително не и от него самото.



"За взимането на сериозно имам пред вид някой да инвестира пари в теб."

И в този смисъл са ме взимали на сериозно. Първото, с което привлякох вниманието на, да го наречем Инвеститора, беше философия: "Схващане за всеобщата предопределеност 2, Вселената сметач".
Инвестира в мен обаче след като му се похвалих със, смея да твърдя добрият синтезатор на реч "Глас" (нещо работещо в изчислителното езикознание; не само философии), написан от нищото за нула време.
Има гласови възможности, каквито "научните" синтезатори на български нямат - плавен преход между периодични функции; плавна реч, а не сричане.

http://geocities.com/todprog/bgr/glas.htm
http://geocities.com/todprog/bgr/glas_.htm
http://www.geocities.com/todprog/glasdemo4.mp3
http://www.geocities.com/todprog/glasdemo3.mp3
http://www.geocities.com/todprog/glasdemo5.mp3
http://www.geocities.com/todprog/glasdemo6.mp3

Например от BACL http://bacl.org твърдят, че в новия SpeechLab 2.0, където използват над 1200 записа на цели дифони от реална реч (чували ли сте за науката Хамалогия?), извършват "спектрална интерполация" при свързването на дифоните.
И какво от това? Спектралната интерполация между ---реални записи--- звучи насечено, както звучи неприятно и слепване на реални записи, без никаква спектрална интерполация.

SpeechLab 2.0 например, който има огромна база данни с граматическа информация, ударения, интонационни контури и не знам си какво, все още срича.

http://195.96.224.22/public/demo.wav


"За българските учени (в България)  Айде да не започваме. Ама има и такива, които работят (в тези нечовешки и дискриминиращи условия)"

Би ли определил какво разбираш под "учен" и "учен, който работи".


"За зародишите на разум не те разбирам. Освен, че от това би излезнала интересна книга, съветвам те да провериш някой дали го е правил преди теб и какви са неговите резултати."

Според мен ако някой имаше успешни резултати в това направление, щеше да има мислеща машина, или поне машина която се развива поне до нивото на дете на няколко месеца или година например.
Галина, за която споменах, например ми е разправила, че е правила опити със самомодифициращи се сложни системи, които се самопострояват от някакъв зародиш,
но ми разправяше, че на настолна машина, нейният метод е невъзможно бавен.



"В общността на учените всички се познават (Щатите, Европа, Австралия, Япония, Израел .... а къде другаде се прави наука?)"

Канада, Корея, Китай, Тайван, Пакистан, Индия, Нова Зеландия.



Поздрави.
Активен
Творчество и изследвания:
http://twenkid.com
http://artificial-mind.blogspot.com

artanis

  • Неактивен Неактивен
  • Публикации: 589
    • http://free.hit.bg/artanis
Re: изчислителна лингвистика
« Отговор #55 -: 21.05.2005, 18:10:09 »

Вербмобайл корпус (Verbmobil) Може би ще е интересно на Тош, защото това е многоезичен гласов корпус, анотиран на много нива, който е създаден за трениране на алгоритми за автоматичен гласов превод. Аз бях впечатлен. Може да се поръча от ELRA/ELDA + The symbolic data can be downloaded for free via FTP ftp://ftp.bas.uni-muenchen.de/pub/BAS/VM

А какви точно са тези символични данни смятам да проверя след малко :)

поздрави:
а.
Активен

artanis

  • Неактивен Неактивен
  • Публикации: 589
    • http://free.hit.bg/artanis
Re: изчислителна лингвистика
« Отговор #56 -: 09.08.2005, 21:05:54 »

Здравейте,

Интересно ми е, някой няма ли желание да пише дипломна работа на тема изчислителна лингвистика?

Направете нещо за езика си без излишни комисии!

Интересни теми са

Автоматично разпознаване на глас.
Морфологичен анализ.
Автоматично резюмиране.

поздрави
Атанас Чанев
Единбург, Шотландия
Активен

Tosh

  • Неактивен Неактивен
  • Публикации: 249
  • Filmmaker
    • Изследванията на Тодор Арнаудов
Re: изчислителна лингвистика
« Отговор #57 -: 10.08.2005, 02:55:01 »


Имам желание да се занимавам с разпознаване на глас, с усъвършенстване на говорния апарат на моя "Глас", с резюмиране и с други обработки на реч като машинно словесно творчество по зададена тема и сюжет; уточняване на теми и сюжет и писане на "скелет" на произведение по грубо описание;  отговаряне на въпроси по текст/текстове от машина. Но не знам дали нещо от тези работи ще стане за дипломна работа.

С разпознаване на глас даже съм започвал да се занимавам практически преди година
от нищото, и стигнах до програмно търсене и разпознаване на почтипериодични функции в зададена честотна граница и степен на "почтипериодичност", на шум и на тишина и извеждане на статисика за затова къде има почтипериодични функции, с каква честота и с колко последователни периода без прекъсване при зададената степен на почтипериодичност: http://geocities.com/eimworld/_5/31/31.htm

Целта беше да класифицира звука, да го разделя на звукове и да познава къде е най-устойчивата, "най-периодична" част от тоналните фонеми ( гласни, звучни съгласни, м, н ).

Поздрави
...
Тош
Кьочук Париж, България ;-)
Активен
Творчество и изследвания:
http://twenkid.com
http://artificial-mind.blogspot.com

artanis

  • Неактивен Неактивен
  • Публикации: 589
    • http://free.hit.bg/artanis
Re: изчислителна лингвистика
« Отговор #58 -: 10.08.2005, 17:03:15 »

Здрасти Тош,

Имам едни пейпъри от курса ми по АРГ. Ще ти пратя заглавията като се върна в Италия. Не е нужно да откриваш топлата вода. Италианците разпознават новинарски емисии. Първо правят спектрален анализ, после трансформация на Фурие, разделят вълната на прозорци и разпознават със скрити модели на Марков.

Във ФМИ с изчислителна лингвистика се занимават Георги Тотков и Христо Крушков. Свържи се с тях. Ако искаш, мога да им пиша за теб (подозирам, че си работил вече с Тотков). Христо Крушков работи със скрити модели на Марков (аз също, така че мога да помагам :))

Със сигурност темата е много интересна, а и после може да си намериш работа в БТК или някой от мобилните оператори.

поздрави:
a.
Активен

Tosh

  • Неактивен Неактивен
  • Публикации: 249
  • Filmmaker
    • Изследванията на Тодор Арнаудов
Re: изчислителна лингвистика
« Отговор #59 -: 11.08.2005, 12:01:54 »

Здравей.

Ще се радвам на "пейпърите"... :)

Да, работил съм с доц. Тотков.

Чувал съм за скритите модели (мрежи?) на Марков, за описание на динамични системи, интересно ми е да разбера какво представляват и как се правят. Мисля че още е малко рано да заявявам интерес обаче (точно сега), май ще е добре малко да се пообразовам предавително как хората си топлят водата...

А и друго - сред колегите се носеха плашещи приказки, че не е препоръчително да се взима тема за дипломна в нач. на 3-ти курс, че били такива, че "цял живот не можеш да ги завършиш"... :) Имаш ли някаква плашеща или успокоителна информация в тази връзка?

За БТК и мобилните - в смисъл работа свързана с DSP?
Или разпознаване на реч, нещо като американскта система за сигурност? ;)
« Последна редакция: 11.08.2005, 12:06:31 от Tosh »
Активен
Творчество и изследвания:
http://twenkid.com
http://artificial-mind.blogspot.com