披露:
此处表达的观点和意见仅代表作者本人,并不代表ethnavigator.com编辑部的观点和意见。
中国公司在人工智能军备竞赛中处于领先地位
中国政治家和计算机科学家楼庆建近期赞扬了DeepSeek的成就,指出:“DeepSeek坚持开源方法,推动人工智能技术在全球的广泛应用,为世界贡献了中国智慧。”
“通过像DeepSeek这样的公司的崛起,我们可以看到中国科技发展的创新性和包容性。”
在二月份于巴黎举行的人工智能行动峰会上,美国副总统JD Vance明确表明特朗普政府在人工智能方面的立场。他表示,特朗普政府将确保美国的人工智能技术在全球保持“金标准”,并且美国公司将继续成为国际公司和外国国家的首选合作伙伴。
副总统认为,过度的监管会扼杀这个新兴行业,政府将鼓励支持人工智能增长的政策。“我希望看到这种去监管的理念在本次会议的很多讨论中得到体现,”他说。Vance还明确表示,人工智能应当不受意识形态偏见的影响,并且“美国的人工智能不会被转化为专制审查的工具。”
最后,特朗普政府将保障人工智能的支持工人增长路径,使其能够在美国创造就业机会。Vance还提到了外部对手利用人工智能软件重写历史、监视用户和进行审查的概念。他指出:
“这当然并不新鲜,因为他们在其他技术上也是如此。一些专制政权窃取并利用人工智能来增强他们的军事情报和监视能力,获取个人数据,制造宣传以破坏其他国家的国家安全。”
他警告与会者不要与这些政权合作。“从CCTV到5G设备,我们都熟悉市场上那些被专制政权大力补贴和出口的廉价技术,”他说。“但正如我所知,我认为我们当中的一些人从经验中了解到,与他们合作意味着将你的国家锁链在一个寻求渗透、深入并夺取你信息基础设施的专制主子手中。”
DeepSeek的技术分析
DeepSeek在一月震惊全球市场,以低成本模型使美国公司似乎在人工智能军备竞赛中落后。该人工智能降低了开发可靠人工智能的成本,证明其是一个强大且高效的开源语言模型。
它改变了我们对开发人工智能所需资本和计算资源的看法。如今,西方世界的研究人员不得不迎头赶上,研究DeepSeek的技术进步及其社会影响。
DeepSeek带来了明显的好处。例如,资金不足的初创公司如今可以在人工智能领域与谷歌和OpenAI竞争。在DeepSeek之后的世界中,人工智能模型能够以更少的资源完成更多工作。该公司声称,仅花费600万美元就使用了2000个Nvidia H800图形处理单元(GPU),而GPT-4的成本在8000万到1亿美元之间,需要16000个H100 GPU。
这家总部位于杭州的初创公司的人工智能模型具备推理能力,使得较小的模型也能发挥作用,而其他人工智能则必须使用更大的模型。它还采用了强化学习,消除了对监督微调的需求。此外,DeepSeek的多头潜在注意力(MHLA)机制将早期人工智能方法的内存使用量降低至5%,而之前为13%。
DeepSeek引发了隐私担忧和关于数据来源及版权的问题。DeepSeek是开放权重的,而非开源。开源模型共享完整的源代码和数据,而开放权重模型共享训练权重但不共享代码。因此,训练模型所用的确切源代码并不可用。
由于DeepSeek的开放权重模型,其数据来源尚不清楚。这似乎是大多数人工智能公司运作的方式。DeepSeek公开了其R1训练和开放权重模型,这将允许其他人工智能开发者复制并构建该模型,但不包括其数据来源。
DeepSeek与地缘政治
中美之间的人工智能主导权竞争愈发显著,而俄罗斯在这方面的能力仍是秘密。俄罗斯最大的国有银行Sberbank已透露其与中国研究人员在人工智能项目上合作的意图。俄罗斯和中国共享所谓的“无限制”战略伙伴关系,长期以来一直谈论人工智能合作,包括在军事应用方面,但公众对其深度或范围知之甚少。
Sberbank在首席执行官German Gref的领导下,曾是一个受累于繁重官僚体制的苏联式前国家储蓄银行,如今已成为俄罗斯人工智能领域的领先企业之一。它于2023年发布了GigaChat模型。“Sberbank有很多科学家。通过他们,我们计划与中国的研究人员进行联合研究项目,”Sberbank首席副总裁Alexander Vedyakhin告诉路透社。
随着人工智能军备竞赛的升温,开源创新的好处愈加突出。世界各地的小花朵在混凝土中破土而出,推出开源和去中心化的酷炫技术。