В последние годы искусственный интеллект стал одной из самых обсуждаемых тем в мире технологий. Однако, как отметил Илон Маск в недавнем интервью, мы, похоже, подошли к критической точке в развитии этой области.
Маск, который является владельцем компании xAI, заявил, что "мы исчерпали практически весь накопленный объём человеческих знаний для обучения ИИ".
Это заявление перекликнулось с мнением Ильи Суцкевера, бывшего главного научного сотрудника OpenAI, который также указал на достижение "пика данных" в индустрии ИИ.Достижение "пика данных" подразумевает, что доступные для обучения ИИ данные становятся всё более ограниченными. Это может вызвать серьезные проблемы для дальнейшего развития технологий, так как современные модели требуют огромного объёма данных для эффективного обучения. По оценкам, в 2024 году 60% данных, используемых в проектах ИИ и аналитики, будут синтетическими. Это подчеркивает необходимость поиска новых подходов к обучению моделей.
Одним из наиболее обсуждаемых решений является использование синтетических данных — данных, которые генерируются самими ИИ-моделями. Маск предложил, что "единственный способ дополнить реальные данные — это синтетические данные", где ИИ может создавать обучающие материалы, тем самым проходя через процесс самообучения. Этот подход уже активно используется крупными технологическими компаниями.
Например, Microsoft, Meta*, OpenAI и Anthropic применяют синтетические данные для обучения своих моделей. Модель Microsoft Phi-4, код которой был опубликован на этой неделе, была обучена на комбинации синтетических и реальных данных. Этот подход позволяет значительно увеличить объём данных, доступных для обучения, а также улучшить качество моделей.
*Meta признана экстремистской организацией, её деятельность на территории России запрещена
Свежие комментарии