Исследователи Apple считают, что MLM больше полагаются на шаблоны, чем на логические рассуждения, пытаясь решить сложные вопросы.

Исследователи Apple высказывали обеспокоенность по поводу математических рассуждений крупных языковых моделей (LMM), обнаружив, что их ответы существенно различаются в зависимости от незначительных входных изменений. Это говорит о том, что МЛМ больше полагаются на вероятностное сопоставление моделей, чем на истинную логику. Чтобы лучше оценить эти возможности, они ввели ГСМ-символический критерий, который показывает, что МЛМ сталкиваются со сложными вопросами, подчеркивая их ограниченность в надежных рассуждениях.

October 11, 2024
8 Статьи