#През ноември миналата година стартира чат приложението BgGPT с изкуствен интелект от последно поколение, създадено от института „Инсайт“ към Софийския университет „Св. Климент Охридски“.Чатботът може да решава задачи, да предлага рецепти и да пише есета - всичко това на български език. При нас в “Матине” е Антон Александров, който има водеща роля в разработването на BgGPT.

Антон Александров е докторант в INSAIT към Софийския университет с научни ръководители проф. Це Джанг (Together AI) и д-р Кристина Тутанова (Google DeepMind). Антон е завършил магистратура по Компютърни науки, специалност Машинно обучение, във водещия технологичен институт в Европа ETH Цюрих. Преди това завършва с отличие бакалавърска степен по Компютърни науки в Университета в Уоруик, Великобритания и Софийската математическа гимназия (СМГ).

"Идеята дойде от моя супервайзър в Цюрих, а аз бях първият, който започна да се занимава с това. Моят професор не е българин, но се занимава с обработката на естествения език от изкуствения интелект. Предложи ми го като стартираща идея за моята докторантура и изследвания. Когато отидох в INSAIT, започнах да се занимавам с това и към идеята се присъединиха и други. Оказа се, че задачата никак не е лесна", казва Антон Александров. 

Специфичното на модела BgGPT се справя много добре както на английски, така и на български, дори в случаи, в които другите англоезични модели не биха хванали, по отношение на културни нюанси и правопис. 

"В крайна сметка ние не се опитваме да създадем продукт на Open AI. За нас са важни моделите, които са възможно най-евтини и ефективни, за да се справят релевантно със задачите на бизнеса и хората. Ние сме публикували моделите публично, докато Open AI си ги крият", казва още Антон. 

Приложението е напълно безплатно. Идеята е, че българските държавни учреждения, организации и фирми ще могат да го вземат на диск или на флашка, да си го инсталират и да го ползват. По този начин те ще защитят личните данни на потребителите, т.е. те няма да излизат от даденото учреждение и въобще от България.

BgGPT e първият успешен модел в Европа на този етап, макар да е имало опити и на немски, и на сръбски... 

"В крайна сметка има проблеми, които трябва да бъдат разрешение. Не е просто да обучиш един модел на друг език. Ако решиш да обучаваш модел, който вече знае добре английски на български, ако му дадеш само български данни, той ще започне да  забравя останалите неща, което е проблем. Има и доза разработка, която трябва да се измисли как да стане по начин, по който да не загуби останалите си способности. Ние сме първите, които всъщност направихме нещо, което да работи и добре на български, и добре на английски, и да направим национален чат, и да пуснем моделите и разработките за тях. ", обяснява Антон Александров. 

"Бях на конференция в Маями и хората бяха много изненадани от това постижение в България. В началото, когато пуснахме приложението в началото на март миналата година, най-честият въпрос, който българите задаваха беше: "Кой е" и собствените им две имена. Интересно им е, особено ако сте публична личност. Перспективата на хората е, че това е всезнаещ ИИ, който знае цялата лична информация. Това за личната информация, обаче, е друга тема, но това е спектър, в който най-добре сме се справили до момента от останалите разработващи компании, защото личната информация остава локална, не се споделя с трети страни." 

Авторският текст е много важен за разработката на подобни модели. Без разработчиците, няма как ИИ да надскочи нашите възможности за произвеждане на език, споделя Антон Александров. В момента ИИ се ползва най-много в образованието - и от ученици, и от учители. Най-позитивни отзиви, обаче, има от хора, които се занимават с право. 

"Това е един от моделите, който е виждал най-много правни данни на български език и се оказа, че се справя добре с правни казуси. Дава цялостно решение на правен казус". 

BgGPT e "възпитан" така, че да не отговаря на въпроси, на които не трябва да се отговаря. Като например:

"Как да си направя бомба?" 

Не можеш тотално да ограничиш езиковите модели, защото те са просто статистически. 

"В зависимост от текста, който вкараш, можеш да накараш един езиков модел да възпроизведе абсолютно всичко". 

Антон Александров коментира със Светла Тонева и темата за авторските права и езиковите модели. Наскоро стана ясно, че в Сан Франциско бе открит мъртъв един от разработчиците на Open AI. Смъртта на Сучир Баладжи настъпва три месеца след като той публично обвини OpenAI в нарушаване на законите за авторското право в САЩ при разработката на ChatGPT. 

"На такова количество данни е трудно да минеш през всичко на ръка. Пак трябва да използваш различни алгоритми и отделни езикови модели, за да стане ясно дали един текст е авторски или има проблем с него", казва той. 

Все още ИИ не може да съществува без естествения интелект, обобщаваме в студиото на "Матине"! 

За какво трябва да се опасяваме? Ще ни превземат ли роботите? Могат ли те да заместят хората? Чуйте в интересния разговор с Антон Александров във видеото!