18 апреля, 06:10
Наука

Тест Тьюринга могут заменить базы данных с текстами ИИ

Проверка текстов через классификатор, созданный на их основе, позволит понять, кем они написаны человеком или машиной, сообщила завкафедрой алгоритмических языков факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова Наталья Лукашевич

НОВОСИБИРСК, 18 апреля. /ТАСС/. Тест Тьюринга для оценки возможностей искусственного интеллекта (ИИ) имитировать человеческую речь и общение в перспективе можно заменить через создание классификатора на основе обширной базы данных текстов ИИ. Проверка текстов через такой классификатор позволит понять, кем они написаны человеком или машиной, сообщила журналистам заведующий кафедрой алгоритмических языков факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова Наталья Лукашевич.

Тест Тьюринга - это метод исследования искусственного интеллекта (ИИ), позволяющий определить, способен ли компьютер мыслить как человек. Тест назван в честь его создателя, британского ученого Алана Тьюринга. Во время теста человек-испытатель взаимодействует с двумя участниками - с машиной и с человеком через текстовый интерфейс. Задача испытателя - определить, кто из участников является машиной, а кто человеком, основываясь исключительно на текстах, которые они пишут.

"В ограниченном наборе вопросов эти модели достаточно долго могут продержаться [при прохождении теста Тьюринга]. Чтобы отличить синтетический текст от обычных можно набирать большие коллекции текстов, раз языковые модели много сочиняют. <...> Плюс много естественных текстов, и сделать специальный классификатор, который сравнивает и пытается отличить", - сказала она.

Ученый добавила, что пока нейросети обучаются на том, что породил человек. "Очень интересны эксперименты, когда модель начинают обучать на том, что она сама породила и получается, что она пока деградирует без человека", - поделилась мнением ученый.

Лукашевич пояснила, что это приводит к снижению качества текстов. Это связано с тем, что на текущий момент нет технологии, которая позволит ИИ преодолеть барьер имитирования. "Это не тот искусственный интеллект, который мы наблюдаем в фильмах, сам дающий указания. На вид они умнее, но часто смешные, глупые ошибки показывают, что это имитация", - добавила она.

Лукашевич создала цикл статей о методах автоматического анализа текстов на русском языке, включая их классификацию, извлечение информации, анализ тональности, семантический анализ и другие виды аналитической обработки текстовой информации. Благодаря работам исследовательницы, в частности, были созданы компьютерно-лингвистические ресурсы, необходимые для обучения нейросетевых систем искусственного интеллекта, в том числе размеченные наборы текстов для автоматического извлечения информации, датасеты для анализа тональности и извлечения аргументации. 

Теги:
Россия
LiveInternet