Upstage韩国LLM击败全球基准ChatGPT_资讯

韩国人工智能创业公司Upstage的最新人工智能模型在世界公认的开源语言模型评估中，得分高于全球人工智能巨头OpenAI的ChatGPT，成为第一个超越世界最著名的聊天机器人模型的大型语言模型(LLM)。

Upstage周二表示，他们的新人工智能模型接受了meta的LLaMA 270b模型的训练，在最新的HuggingFace Open LLM排行榜上获得了72.3分的平均得分，这是一个由500多名法学硕士竞争的开源法学硕士评估标准。

三星电子表示，这是第一次在非主流人工智能模型上超越搭载GPT-3.5的ChatGPT，证明了三星电子在全球人工智能舞台上的技术实力。

ChatGPT的基准分数是71.9。

此前，拥有300亿个参数的前一款LLM模型以平均64.7分的成绩战胜了meta在上月同日推出的LLaMA 270b模型，跃居排行榜首位。

Upstage表示，最新的LLM是最新的LLaMA 2，参数更大，达到700亿。

对PIo从来没有全球私人人工智能市场

HuggingFace排行榜评估了四个关键指标，包括推理挑战、常识推理、上下文理解和事实准确性，以衡量人工智能幻觉的水平。

(Courtesy　of　Getty　Images)

凭借70B LLM，该公司从“稳定AI”的“稳定白鲸2”(Stable Beluga 2)手中夺回了冠军。自“稳定白鲸2”推出以来，“稳定白鲸2”以71.4分击败了韩国LLM。

周二，Upstage表示，在展示其技术优势之后，该公司计划进军民间人工智能市场。

私有人工智能是一种商业人工智能解决方案，具有强大的数据保护和安全系统，因为它是在公司的私有内部数据集上专门训练的。

它之所以受到关注，是因为它产生虚假信息的人工智能幻觉风险较小。

Upstage代表金成勋(音)在新闻发布会上表示:“Upstage将以卓越的技术专长，努力提高在国内外民间人工智能市场的领先地位。”

三星证明，即使成本更低，规模更小的人工智能模型也能与规模更大的全球巨头竞争，因此在人工智能解决方案上押下了重金。

Upstage's　first-ever　press　conference,　on　May　16,　2023,　since　its　launch　in　2020　(Courtesy　of　Upstage)

据报道，这一成果归功于开发了韩国语理解(NLU)数据集KLUE和主打聊天机器人AskUp的优秀人工智能专家团队。

以OpenAI的GPT-4为基础开发的韩国第一个聊天机器人服务AskUp，目前拥有约130万名用户。

该团队仅用了两个月的时间就开发出了与LLaMA 2模型进行了微调的最新LLM。

Upstage成立于2020年，由曾任香港科技大学教授、能将软件工程和机器学习融合在一起的世界顶尖人工智能专家金教授领导。他还主导了Naver Clova AI的开发。

开发Naver Visual AI团队的李哈尔锡(音)和Kakao AI团队的前负责人金在范(音)也加入了该团队。

据该公司称，来自meta、英伟达和亚马逊等美国大型科技公司的其他人工智能工程师也加入了该公司。

Upstage韩国LLM击败全球基准ChatGPT