Проблеми штучного інтелекту

Ось приклад такої класифікації за Величковським:


Ознаки глибини

Бінокулярність/ монокулярність

Абсолютність/ відносність

Якісність/ кількісність

Бінокулярний паралакс

Б.

В.

К.

Вергентні рухи очей (до 3 м)

Б.

А.

К.

Акомодація хришталика (до 2 м)

М.

А.

К.

Монокулярний параллакс (руховий)

М.

А./В.

К.

Перекриття поверхонь, текстур

М.

В.

Я.

Градієнти величин, густини

М.

А./В.

К.

Знання розмірів, віддаленності

М.

А.

К.

Висота положення у полі зору

М.

В.

К.

Розмирість контурів, колір

М.

В.

К.

Розподіл світла і тіні

М.

В.

Я./К.

Розділення на фігуру і фон

М.

В.

Я.


Тепер можна розглянути за допомогою яких ознак машина будує третій вимір. Кожна з них має деякі недоліки, а в сумі всі разом дають досить точну картину сцени.

Рух

Відеокамери дозволяють отримувати до кількох десятків кадрів за секунду і різниця між кадрами може стати вагомим джерелом інформації про третій вимір сцени, така послідовна у часі зміна у зображенні одного об’єкту називається оптичним потоком. З нього витягуються дані, за якими будується модель, такими даними можуть стати напрям вектору руху, швидкість зміни зображення, прискорення зміни зображення, тощо.

Бінокулярні стерео дані.

Якщо машина створена за подобою людини, то має отримати від свого творця і дуже важливу деталь – бінокулярний зір. Бінокулярна побудова тривимірного зображення побудована на принципі, що ми розглянули вище. Тільки діставання кількох зображень досягається не за рахунок руху, а за рахунок сприймання одночасно двох різних зображень. Різниця між ними полягає у зсуну тості одне відносно одного, а отже після співставлення двох зображень буде ідентифікована неузгодженість. Третій вимір відновлюється на основі аналізу дивергенції осей зору і неузгодженості зображень, вираховуючи відстань до об’єкта за геометричними правилами.

Градієнти текстури

Під текстурою у повсякденному житті розуміється властивості об’єктів, пов’язані з тактильними відчуттями, що вони викликають. А у проблемі зорового сприйняття простору – наявність малюнку, що повторюється на поверхні і який може бути віднайдений візуально. Також до текстури відноситься і поняття густоти – частоти розташування елементів малюнку текстури, текстелів. Існує дві причини, через які однаковість малюнку може викривлюватись: різні відстані між камерою і текстелами; різні ракурси на тек стели. За допомогою математичного аналізу можна створити градієнти текстури, тобто показники швидкості зміни різних характеристик текстелів. Для відтворення даних про форму машини виконують двофазне завдання

1)                 вимір градієнтів текстур

2)                 оцінка значень можливих змін форми і положення, що могли б призвести до такої зміни текстури

Затінення

Затінення – зміна інтенсивності світла, визначається геометричною

будовою сцени і характеристиками поверхонь. Задачу по відтворенню характеристик сцени за яскравістю пік селів майже неможливо розв’язати і такий спосіб обрахунку третього виміру застосовний тільки в найпростіших випадках. До складнощів призводить велика кількість взаємо відбивань променів при наявності великої кількості предметів з різними, невідомими коефіцієнтами заломлення. Безсумнівно, люди здатні до такого типу аналізу навколишнього світу, тому вказана проблема є одним з напрямків для подальшого вивчення.


Контури


Контурний малюнок може дати нам велику кількість інформації про взаємо розташування предметів на ньому, нахилі і попороті поверхонь. Таке відчуття може досягатися завдяки поєднанню знань вищого рівня (досвіду) зі знаннями нижчого (ситуативними). Всі лінії на малюнку можуть приймати багато значень, і важливою задачею постає розмітка їх, тобто оцінка значення кожної з них. Саме ця задача була однією з найперших, що вивчалася у розділі машинного зору. Кожну лінію можна віднести до проекції лімба (сукупність точок, що ми бачимо там, де лінія зору походить по дотичній до поверхні) чи краю (звичайна лінія). При цьому краї діляться на вгнуті, опуклі чи закриваючі (ті, що закривають те, що знаходиться за ними). Кожній лінії можна присвоїти символ, що буде позначати її вид, такий символ називають міткою. На прикладі тригранних об’єктів Хаффмен і Клоувс незалежно один від одного створили повний перелік всіх можливих групувань цих видів контурів. При використанні цього словника об’єднань при аналізі контурного малюнка необхідно вирішувати задачу визначення того, які поєднання є співставні. Для цього існує правило, за яким кожній лінії можна присвоїти тільки одну мітку.

Розпізнавання об’єктів.

У людській свідомості усі об’єкти класифіковані. Ця класифікація випрацьовується протягом усього життя і відрізняється високим ступенем узагальненості. В області штучного інтелекту здатність розпізнавати предмети прийнято називати розпізнаванням об’єктів. До цього відноситься як розпізнавання класів об’єктів (собака) так і одиничних об’єктів (мій собака Рекс). Люди можуть розпізнавати не тільки об’єкти, але і види діяльності, наприклад посмішку, біг, писання, тощо, але для машин розпізнавання такого високого рівня знаходиться ще у стадії розробки. Складності викликає навіть елементарне розпізнавання об’єктів, адже машина має робити це незалежно від освітлення, оточення, положення, умов бачення.

Насамперед постає проблема сегментації об’єктів. Існує два способу детектування об’єкту. «знизу-вверх» і «зверху-вниз». Перший з них може призводити до багатьох помилок, але є на багато простішим для обрахунку. Віг полягає у розбитті об’єктів на сегменти і аналіз сегментів. Другий спосіб, що зазвичай використовується у всіх системах, вимагає складних обрахунків, адже полягає у пошуку необхідного об’єкта на площині всього зображення. На даний момент перспектива вбачається у розвитку і покращенні першого методу.

Іншою задачею є розпізнавання об’єкту незалежно від модифікацій його форми чи положення. Слід зазначити, що зміни між об’єктами всередині класу і через модифікації станів носять різний характер. Одним з варіантів розв’язання цієї проблеми є зведення об’єктів до початково заданого стану, але для цього необхідно задати всі об’єкти.

Існує два підходи до розпізнавання об’єктів: розпізнавання з врахуванням яскравості і розпізнавання з врахуванням характеристик. При обранні першого методу за основу береться пошук області пікселів, що відповідає шуканому об’єкту і обробка цієї області. Цей спосіб ґрунтується на аналізі необроблених зображень. Другий метод навпаки, використовує вже сегментовані зображення. Це допомагає досягнути скорочення часу детектування образу і досягнення інваріантності освітлення.

Цікавою задачею також постає оцінка пози, тобто позиції і орієнтації, об’єкту. Це відіграє велику роль при необхідності маніпулювання предметами. Задача вирішується досить просто і визначено, для цього використовується метод вирівнювання. В його основу покладено порівняння контурів проекції тривимірної моделі при її трансформації і двовимірного зображення.

Комп’ютерна мова

Одна із важливих задач, що стоїть перед сучасними комп”ютерами – розпізнавання і генерація поми. Мова – домінуюча форма спілкування у людей. Розпізнавання мови можна інтерпретувати як власне розпізнавання порядку слів, що було сказано або ж як ідентифікацію смислу фрагментів мовлення. Мова – доже складна система, для комп’ютерів особливо складним виявляється велика її зашумленість під зашумленістю мови можна розуміти як звичайні фізичні шуми, так і нескінченну кількість варіантів вимови. Саме це підштовхнуло вчених до думки, що розпізнання мови має будуватися на імовірнісній основі. Основні моделі, що використовуються у розпізнавачах мови зазвичай дуже прості. Наприклад модель двослівних поєднань вираховує вірогідність використання одного слова, в залежності від іншого. Таке обрахування необхідне при появі у словосполученні омофонів. В основі розпізнавання мови лежить те, що у всіх мовах використовується в основному досить обмежений і однаковий набір фонем (40-50). Але є і такі, що використовуються тільки в окремих мовах.

Звуки мови

Сприйняття звуків для машини проходить з допомогою мікрофону і аналогово-цифрового перетворювача, що виміряє величину струму, у який мікрофон перетворив коливання мембрани. Для обробки мови зазвичай використовуються частоти від 8 до 16 кГц. Хоча звукові частоти мови і досягають таких високих значень, але зміна змісту сигналу проходить набагато рідше, приблизно 100 Гц. Через це, для зменшення об’єму опрацювання інформації, при аналізі використовують більші проміжки часу, фрейми (~ 10 мс). У межах кожного фрейму його характеристики задаються векторами.


 

1)                частотний ряд деякого звуку.

2)                Оброблений сигнал

3)                Фрейми з виділеними характеристиками (3)


У реальних системах використовуються сотні таких характеристик фреймів, але все ж. очевидно, що при такій обробці деяка частина інформації втрачається. Задача обробки звукової інформації полягає у тому, щоб, знищивши усі шуми на кшталт гучності, швидкості промови, тощо, вичленувати центральні характеристики, що є основними для даного звуку. Допомагає у цьому також класифікація фонем за їх складом. Наприклад якщо подібним образом описувати букву «т», то можна сказати, що вона складається з трьох станів: тихий початок, невеликий вибух (звільнення повітря) в середині і, як правило, шипіння у кінці.

Логічні системи в мові

Для того, щоб підтримувати розмови з людьми необхідно вміти розпізнавати зли тну мову, а не тільки окремі її елементи.. але насправді, зв’язна мова це не просто послідовність її елементів. І послідовність найбільш імовірних слів не є найбільш імовірною послідовністю слів. Отже, вирахувавши найбільш імовірні слова за використанням фонем, машина не може точно визначити речення в цілому, адже використання слів значно змінюється в залежності від того, в оточенні яких слів воно знаходиться і на якій позиції. Інша проблема – проблема сегментації, тобто розрізнення кінця одного слова і початку іншого, адже зазвичай у повсякденному мовленні у реченні між словами немає пауз. Як і більшість проблем у розпізнанні мови, ця задача вирішується на базі імовірнісних обрахунків.

Розуміння мови

Розробка способів розуміння природного мовлення є одним з найперспективніших і найнеобхідніших напрямків розвитку галузі штучного інтелекту. Цей напрям базується на методах логічного та імовірнісного пред’явлення знань і формуванні роздумів. На відміну від інших областей штучного інтелекту, саме ця потребує детального дослідження поведінки людей, адже мова – засіб комунікації, притаманний тільки їм і у великій мірі відображає людську психологію. Люди посилаюсь інформацію, закодовану у мові, з метою досягнення деяких цілей, мовленнєві акти є нічим іншим, як спробою примусити інших суб’єктів зреагувати певним чином. Мова – єдина в своєму роді знакова система, що використовує граматику для генерації структурованих повідомлень, що характеризуються необмеженою різновидністю. Усі варіанти використання мови є ситуативними, тобто смисл фрагменту мовлення залежить від ситуації, в якій був створений.

Для покращення розуміння граматичних схем, машини можуть використовувати розширення граматики, тобто граматику визначених висловлювань (Definite Clause Grammar— DCG). Важливою проблемою при розумінні природної мови є її неоднозначність. Більшість висловлювань може приймати декілька значень, вірне з яких, на даний момент, лише одне. Відкинення неоднозначності виконується на основі знань про світ і сучасну ситуацію у ньому.

Не дивлячись на те, що такі сучасні системи генерування мови як Parry? NET talk та інші досить добре можуть імітувати природній діалог з людиною, вони, все ж, не можуть обманювати співрозмовника дуже довго. Їх проблема полягає не у пам’яті, не у здатності генерувати вагомі речення, а у недостатньому розумінні машинами мови, що вони використовують. Комп’ютерний аналіз складних взаємовідносин у середині мови призвів до створення досить складних програм, що здатні розуміти мову. Прекрасним прикладом для цього може слугувати перекладач Google.

Навчання машин. Навчання на основі спостережень

Научіння – одна з найнеобхідніших якостей людини, без якої ми не тільки не розвинулися до сучасного стану, але і просто вимерли б як вид. Зрозуміло, що одним з перспективних напрямків вивчення штучного інтелекту є проблема научіння машин. Якщо вдасться створити такий комп’ютер, що буде здатен сам себе вчити, то відпаде необхідність створення нових програм для засвоєння ним нових можливостей. Проблема научіння лежить в аспекті використання сприйнятої інформації не тільки для виконання дій, а і для підвищення здібностей машини. Існує кілька видів научіння.

Научіння, що контролюється базується на вивченні деякої функції на її вхідних та вихідних даних. Правильне вихідне значення може задаватися учителем або з власних спостережень комп’ютера. Якщо машина може спостерігати за своїми діями, то не виникає проблем з використанням методу контрольованого научіння. У інших випадках, тобто якщо результати дій не повністю доступні для сприйняття, зазвичай використовується спосіб неконтрольованого научіння. Цей метод використовується коли комп’єютер не може визначити правильність чи неправильність вихідного значення функції, він базується на імовірнісних обрахунках. Найбільш загальною з цих категорій є задача научіння з підкріпленням. Такий спосіб научіння не потребує вказівок учителя, а працює завдяки підкріпленням.

Іншим важливим аспектом в навчанні машин є наявність початкових знань. У процесі навчання, людина отримує безліч побічних знань, що дозволяє краще накласти новий матеріал на вже існуючий. Також і для штучного інтелекту, значно продуктивнішим є навчання, що накладається на деякий вже існуючий багаж знань.

Індуктивне навчання.

Будь – який алгоритм навчання включає в себе задачу відновлення функції, що призвела до правильного результату або побудови іншої функції, близької до неї. Функція, яку генерує комп‘ютер називається гіпотезою. Якісна гіпотеза має правильно передрікати появу ще не отриманих результатів, в цьому і постає фундаментальна проблема індукції.

З самого початку не можливо визначити, чи можливо знайти таку гіпотезу. Можливість знаходження гіпотези залежить від обраного простору гіпотез. Прийнято вважати, що задачу навчання можливо реалізувати, якщо простір гіпотез містить необхідну функцію, і що її реалізувати неможливо, якщо простір гіпотез такої функції не містить.

Навчання ансамблю

На відміну від індуктивного навчання, цей метод постоїть у тому, що з простору слід обирати цілий набір гіпотез. Потім проводиться комбінування передбачень на їх основі і голосування для визначення найкращої класифікації нового прикладу. Причина переваги такого методу полягає у меншій вірогідності обрання неправильної класифікації прикладу, адже на відміну від попереднього способу, де висновок робився на результаті однієї гіпотези, при обранні ансамблю гіпотез (наприклад їх кількість - 5), для обрання хибної класифікації помилку повинні зробити щонайменше 3 з 5 відібраних гіпотез.

Також побудова ансамблю гіпотез допомагає у побудові нових просторів гіпотез, що сформовані з гіпотез першопочаткового простору. Такий підхід призводить до побудови більш виразних просторів гіпотез.

Теорія обчислювального навчання

Вище було поставлене важливе питання, відповідь на яке поки що не давалася. Як саме можна впевнитися, що в результаті алгоритму навчання було створено теорія, що дозволяє правильно прогнозувати майбутнє? А точніше – наскільки відтворена функція відповідає початковій. Пояснення того, що алгоритми навчання працюють лежить у теорії обчислювального навчання, у основі якого лежить принцип, що говорить: «Будь-яка гіпотеза, що містить серйозні помилки, буде «відкрита» с великою імовірністю після обробки невеликої кількості прикладів, оскільки вона виносить неправильні передбачення. Тому будь-яка гіпотеза, що співставлень з достатньо великою кількістю прикладів під час навчання, з низькою імовірністю буде містити серйозні помилки; це означає, що вона обов’язково буде приблизно правильно. З визначеною імовірністю» (Artificial Intelligence: A Modern Approach, Russel and Norvig)

Використання знань у навчанні

Також слід окреслити проблему використання початково наданих, або вже здобутих знань машиною у подальшому процесі навчання. Апріорні знання можуть допомагати у навчанні, відмітаючи хибні гіпотези, які, за обставин відсутності таких знань, класифікувалися б як спів ставні. Успішне використання апріорних знань у процесі навчання доводить, що ще більш перспективним є кумулятивне навчання, тобто таке, в якому комп’ютер підвищує свою здатність до навчання з набуттям більшої кількості знань. У метода навчання на основі пояснення (Explanation-Based Learning — EBL) передбачається витягнення загальних правил з конкретних прикладів і узагальнення пояснень. Такий дедуктивний метод дозволяє перетворювати знання основних принципів у корисні, ефективні знання спеціального значення.

«Машинна творчість»

Одною з найперспективніших галузей в області штучного інтелекту є штучна творчість. Творчість як феномен ще дуже мало вивчений у людини, це велике поле для сучасних психологів. Але на даному етапі існування штучного інтелекту вже можливе моделювання творчого процесу, і можливо саме це моделювання зможе допмогти нам у вивченні людської творчості.        

Страницы: 1, 2, 3, 4, 5



Реклама
В соцсетях
бесплатно скачать рефераты бесплатно скачать рефераты бесплатно скачать рефераты бесплатно скачать рефераты бесплатно скачать рефераты бесплатно скачать рефераты бесплатно скачать рефераты