Весь мир гудит про AI. Я решил проверить его в деле: написал с помощью AI-ассистента рабочее приложение на Python, который я почти не знаю. Точнее так: я понимаю суть того, что происходит, могу понять, как и что работает, но не знаю языковых конструкций, не знаю подводных камней языка, но точно знаю, что и как я хочу получить. Купил подписку на Cursor, поставил себе цель-вызов разобраться с вайб-кодингом.
Вернемся к проекту. Итак, есть цель: написать приложение на Python в Cursor API для извлечения текста из документов самых различных форматов. На вход в API передаем файл, на выходе получаем текст. Мы хотим с коллегами подготовить RAG для нашей базы знаний, чтобы можно было искать информацию с использованием AI и обучать по нашим данным. Тут, конечно, нужна целая инфраструктура, но начинаем мы с малого. Один из кирпичиков — это извлечение текста из всего, что можно.
▶️ Читать мою статью на Хабре: https://habr.com/ru/companies/softonit/articles/925716/
▶️ Скачать инструмент на GitHub: https://github.com/Diversus23/extract-text
Все абсолютно бесплатно.
Выводы: что точно могу сказать? AI — может. И да, это только начало. Но главная проблема в том, что ей надо четко ставить цели, писать ТЗ и корректировать ее работу, постоянно возвращая в рабочее русло. Я как-то объяснял не ИТ-шнику, что такое ИИ и как он работает, и нашел, как мне кажется, отличную аналогию.
Представьте, что ИИ — это бригада очень качественных строителей, при этом они не боятся работы, но не всегда тебя слушают, и если им покажется, что сделать по-другому будет лучше, или в твоих словах найдут несостыковки, то они сделают все по-своему. Говоришь: «Постройте мне стену», и они ее сделают. Но не из того материала, не там, где ты хотел, и не той толщины, но сделают на их взгляд отлично! ))) Улавливаете суть? Нужно точно говорить, где ставить стену, как ее строить, что в какой последовательности делать и из какого материала, тогда результат будет именно тот, который вы ожидаете. Ну и да. Нужен контроль. Все сделано? Надо проверить, нет ли в новой стене дырок, точно ли раствор тот и т. п.
Понятно, что это только начало, но даже так это отличный помощник, который может на себя забрать часть рутины (и не только).