Изследване на Microsoft: Езиковите модели не са готови да заменят служителите
Изследователи от Microsoft стигат до извод, който вероятно няма да се хареса на много компании, инвестиращи агресивно в изкуствен интелект. Според ново проучване водещите AI модели все още се справят слабо при реални офис задачи и често допускат сериозни грешки.
Данните идват от научна работа, която все още не е преминала независима рецензия. Проучването е забелязано първо от IT Pro.
Екипът тества няколко от най-модерните AI системи, включително GPT 5.4 на OpenAI, Claude Opus 4.6 на Anthropic и Gemini 3.1 Pro на Google.
Според резултатите моделите повреждат средно около 25% от съдържанието в документи при по-сложни задачи. По-старите AI системи се представят още по-слабо.
Изследователите стигат до извода, че тези модели „не са готови за делегирани работни процеси в огромната част от сферите„.
Заключението е особено интересно на фона на огромните инвестиции на Microsoft в изкуствен интелект. Компанията активно интегрира AI функции в Windows 11 и други свои продукти, като позиционира технологията като инструмент за повишаване на продуктивността.

Любопитното е, че проучването не включва собствената AI платформа Copilot на Microsoft.
Според авторите сляпото доверие към езиковите модели при работа с вътрешни документи може да доведе до грешки, загуба на информация и повреда на данни.
Темата идва на фона на нарастващия интерес към автоматизацията на офис дейности чрез генеративен изкуствен интелект. Много компании вече използват AI за писане на текстове, обработка на документи, анализ на данни и комуникация.
Паралелно с това обаче се появяват и все повече критики към т.нар. „workslop“ – съдържание, генерирано от AI, което изглежда приемливо на пръв поглед, но изисква сериозна човешка редакция и проверка.
Новото изследване на Microsoft подсказва, че въпреки бързото развитие на технологията, AI системите все още не могат надеждно да заменят хората при сложни работни процеси.




Post Comment