老米吧 关注:21,613贴子:1,281,785
  • 24回复贴,共1

大模型卷疯了,只有更低没有最低

只看楼主收藏回复

2月6日消息,美国斯坦福大学和华盛顿大学研究人员李飞飞团队宣布,以低于50美元的云计算成本训练出人工智能推理模型s1-32B。
该模型在数学及编码测试中表现与OpenAI的o1、DeepSeek的R1等尖端模型相当,引发行业关注。
据媒体报道,s1-32B实为基于阿里云通义千问Qwen2.5-32B-Instruct开源模型的微调产物。
报道称,阿里云证实,该团队以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,在16块H100GPU上监督微调26分钟,训练出新模型s1-32B,取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比o1-preview高出27%。


IP属地:浙江1楼2025-02-07 12:30回复
    低于50美元的云计算成本训练出人工智能推理模型s1-32B,
    这个成果又把刚刚捧上天的DEEPSEEK压了下去。


    IP属地:浙江2楼2025-02-07 12:34
    回复
      广告
      立即查看
      我表示对DEEPSEEK很赞,但真的很反感那些以DEEPSEEK取得成绩开始自嗨模式的人,居然扯到国运之战上去了,这种毫无底线的蹭流量博眼球的媒体,好恶心。


      IP属地:浙江3楼2025-02-07 12:35
      收起回复
        你不是马后炮,你是真天才


        IP属地:天津来自Android客户端4楼2025-02-07 12:35
        回复
          我不是早就说过了吗?这个是除夕的截图


          IP属地:浙江来自iPhone客户端5楼2025-02-07 13:07
          回复
            这正是deepseek的伟大之处,它在老美苦心修筑的Al大坝旁挖了一条斜坡,现在大家都知道如何挖斜坡了,没必要向英伟达买云梯了。


            IP属地:广西来自Android客户端6楼2025-02-07 15:07
            收起回复
              Qwen2.5-instrut,我家姑娘说,用过的都知道, 32B 模型里的最强者,没有之一(原话)。我是不懂的,她是建筑类研究生,应该也是不懂的,可能用到过。


              IP属地:浙江来自Android客户端7楼2025-02-07 15:25
              回复
                大概率是假的,真50美金就能训练出来,英伟达昨晚不跌个50%都算少的, 可惜还涨了点


                IP属地:陕西来自Android客户端8楼2025-02-07 19:29
                回复
                  广告
                  立即查看
                  假的要死,美国股市毫无反应罢了


                  IP属地:广东来自iPhone客户端9楼2025-02-07 19:38
                  回复
                    所以阿里涨了吗?英伟达跌了吗


                    IP属地:浙江来自Android客户端10楼2025-02-07 20:26
                    收起回复
                      S1—32B,呵呵,前后两个字母,我觉得你是在侮辱大家的智商


                      IP属地:四川来自Android客户端11楼2025-02-08 11:07
                      收起回复
                        这个说明了蒸馏的高效,但是换句话说,如果没有大模型,你蒸馏谁去


                        IP属地:北京来自iPhone客户端12楼2025-02-08 11:38
                        回复
                          让子弹飞


                          IP属地:江西13楼2025-02-08 12:41
                          回复
                            关于这个训练成本吧,我觉得有点像开奥运会,你说自己没花多少钱,但是吧。。。


                            IP属地:北京14楼2025-02-08 19:28
                            收起回复
                              广告
                              立即查看
                              翻车了


                              IP属地:陕西来自Android客户端15楼2025-03-02 09:13
                              回复