ChatGPT – это экстраполяция класса моделей обработки естественного языка машинного обучения, известных как Large Language Model (LLM). LLM переваривают огромное количество текстовых данных и выводят взаимосвязи между словами в тексте. Эти модели выросли за последние несколько лет, поскольку мы наблюдаем прогресс в вычислительной мощности. LLM расширяют свои возможности по мере увеличения размера их входных наборов данных и пространства параметров.
Самое базовое обучение языковым моделям включает в себя предсказание слова в каких-либо последовательностях. Чаще всего это наблюдается либо как предсказание токена, либо как маскированная языковая среда.