Учитесь языкам естественно со свежим, подлинным контентом!

Исследовать по регионам

Китайский стартап AI DeepSeek вводит новый метод повышения эффективности крупных моделей, снижения издержек и повышения масштабируемости. Chinese AI startup DeepSeek introduces new method to make large models more efficient, reducing costs and boosting scalability.

flag Китайский стартап DeepSeek представил новый метод обучения под названием Manifold-Constrained Hyper-Connections, предназначенный для повышения эффективности и масштабируемости крупных моделей ИИ при одновременном снижении вычислительных и энергетических затрат. flag DeepSeek, a Chinese AI startup, has unveiled a new training method called Manifold-Constrained Hyper-Connections, designed to make large AI models more efficient and scalable while reducing computational and energy costs. flag Эта техника, подробно описанная в документе, подготовленном основателем Ляном Вэньфенгом и опубликованном на сайте ArXiv, затрагивает проблемы нестабильности и памяти в предыдущих моделях, обеспечивая стабильную подготовку в рамках 3-27 миллиардов систем параметров с минимальным добавлением вычислений. flag The technique, detailed in a paper co-authored by founder Liang Wenfeng and published on arXiv, addresses training instability and memory issues in prior models, enabling stable training across 3 billion to 27 billion parameter systems with minimal added compute. flag Основываясь на предыдущей работе ByteDances, этот подход отражает стремление Китая к инновациям ИИ, несмотря на ограничения полупроводников США. flag Building on ByteDance’s earlier work, the approach reflects China’s push for AI innovation despite U.S. semiconductor restrictions. flag Выпуск подпитывает ожидания следующей крупной модели DeepSeek, возможно R2, ожидаемой во время Фестиваля Весны в феврале. flag The release fuels anticipation for DeepSeek’s next major model, possibly R2, expected around the Spring Festival in February.