開源模型
王興一鳴驚人!美團(tuán)首個(gè)開源大模型追平DeepSeek-V3.1
網(wǎng)友:這下好了,Meta連送外賣的都比不過
中國最大開源MoE模型,255B參數(shù)無條件免費(fèi)商用,元象發(fā)布
同時(shí)訓(xùn)練時(shí)間減少30%,推理性能提升100%
換掉Transformer,7B開源模型立刻登頂!任意長序列都能處理
完全沒用注意力機(jī)制
網(wǎng)友:這下好了,Meta連送外賣的都比不過
同時(shí)訓(xùn)練時(shí)間減少30%,推理性能提升100%
完全沒用注意力機(jī)制