05.05.2025 20:00

Google будет обучать свои поисковые ИИ-продукты на контенте из интернета

Google (материнская компания Alphabet, GOOGL) может продолжить использовать материалы с интернета для обучения своих ИИ-продуктов, таких как AI Overviews, даже если издатели отказались от использования их контента, сообщает Bloomberg. 


Об этом сообщил вице-президент Google DeepMind Эли Коллинз в ходе судебного разбирательства. По его словам, отказ издателей распространяется только на подразделение Google DeepMind, но не касается других продуктов компании, в том числе поисковой системы Google. Это значит, что поисковик Google может использовать данные, от которых отказались веб-сайты, для улучшения своих ИИ-функций.


В ходе суда выяснилось, что Google удаляет около 50% контента (80 из 160 миллиардов «токенов») из-за отказа издателей, но оставшиеся данные продолжают использоваться для обучения моделей. Компания также рассматривает возможность улучшения ИИ с помощью данных поисковой выдачи и контента с YouTube. В последние годы Google активно внедряет технологии ИИ в свой поисковик, чтобы повысить точность поиска и улучшить пользовательский опыт.


Одна из ключевых технологий в этом процессе — MUM, мощная модель машинного обучения, которая понимает информацию на нескольких языках и эффективно справляется со сложными запросами. 


Безусловно, этот судебный процесс против Google аналогов ни в США, ни за рубежом не имеют, поскольку «соответчиком» Google в суде фактически стал искусственный интеллект, и чем закончится такой процесс для техногиганта, предсказать сложно, отмечает ведущий аналитик Freedom Finance Global Наталья Мильчакова. Хотя, по всей видимости, несмотря на продвинутые возможности ИИ от Google, аргумента адвокатов Google о том, что модели ИИ, разработанные корпорации, могут быть обучаемы на основе только открытых источников, будет недостаточно для доказательства, что Google не имеет монополии на поисковые ИИ-продукты.