• 联系我们
  • FAQ
加入收藏
比特900财经
  • 首页
  • 7×24
  • 市场行情
    • 比特币(BTC)
    • 以太坊(ETH)
    • Ripple(XRP)
    • Chainlink(LINK)
    • Litecoin(LTC)
    • Cardano(ADA)
    • Zcash (ZEC)
    • Altcoin(ALT)
    • Dogcoin
    • EOS
  • 区块链
  • 交易所
  • NFT
  • DeFi
  • Layer 2
  • Web 3
  • 技术创新
  • 深度观察
  • 联系我们
No Result
View All Result
  • 首页
  • 7×24
  • 市场行情
    • 比特币(BTC)
    • 以太坊(ETH)
    • Ripple(XRP)
    • Chainlink(LINK)
    • Litecoin(LTC)
    • Cardano(ADA)
    • Zcash (ZEC)
    • Altcoin(ALT)
    • Dogcoin
    • EOS
  • 区块链
  • 交易所
  • NFT
  • DeFi
  • Layer 2
  • Web 3
  • 技术创新
  • 深度观察
  • 联系我们
No Result
View All Result
比特900财经-专业比特币财经媒体
No Result
View All Result
Home 7x24

越大并不总是越好:混合人工智能模式如何支持更小的语言模型

digger by digger
26 4 月, 2024
in 7x24, 区块链
0
越大并不总是越好:混合人工智能模式如何支持更小的语言模型
189
SHARES
1.5k
VIEWS
Share on FacebookShare on Twitter


随着大型语言模型 (LLM) 进入通用语言,人们已经发现了如何使用访问它们的应用程序。 现代人工智能工具可以生成、创建、总结、翻译、分类甚至对话。 生成人工智能领域的工具使我们能够在从现有工件中学习后生成对提示的响应。

没有太多创新的一个领域是在最边缘和受限的设备上。 我们看到一些版本的人工智能应用程序在移动设备上本地运行,具有嵌入式语言翻译功能,但我们还没有达到法学硕士在云提供商之外产生价值的程度。

然而,还有一些较小的模型有潜力在移动设备上创新新一代人工智能功能。 让我们从混合人工智能模型的角度来研究这些解决方案。

LLM 的基础知识

法学硕士是一类特殊的人工智能模型,为这一新范式提供动力。 自然语言处理 (NLP) 支持此功能。 为了培训法学硕士,开发人员使用来自各种来源(包括互联网)的大量数据。 处理的数十亿个参数使得它们如此之大。

虽然法学硕士了解广泛的主题,但他们仅限于接受培训的数据。 这意味着它们并不总是“最新的”或准确的。 由于其规模,LLM 通常托管在云端,这需要具有大量 GPU 的强大硬件部署。

这意味着希望从私人或专有业务数据中挖掘信息的企业无法立即使用法学硕士。 要回答特定问题、生成摘要或创建摘要,他们必须将其数据纳入公共法学硕士或创建自己的模型。 将自己的数据附加到 LLM 的方法称为检索增强生成,或 RAG 模式。 它是一种将外部数据添加到 LLM 的 gen AI 设计模式。

是不是越小越好?

电信公司、医疗保健公司或石油和天然气公司等从事专业领域运营的企业拥有激光焦点。 虽然他们可以而且确实从典型的一代人工智能场景和用例中受益,但较小的模型会更好地为他们服务。

以电信公司为例,一些常见的用例是联络中心的人工智能助理、服务交付中的个性化产品以及用于增强客户体验的人工智能聊天机器人。 帮助电信公司提高网络性能、提高 5G 网络频谱效率或帮助他们确定网络中特定瓶颈的用例最好由企业自己的数据提供服务(而不是公共法学硕士)。

这让我们得出这样的观念:越小越好。 现在有小语言模型(SLM),其规模比 LLM 更“小”。 SLM 接受数十亿个参数的训练,而 LLM 接受数百亿个参数的训练。 更重要的是,SLM 接受了特定领域数据的训练。 他们可能没有广泛的背景信息,但他们在自己选择的领域表现得非常好。

由于尺寸较小,这些模型可以托管在企业的数据中心而不是云中。 SLM 甚至可以在单个 GPU 芯片上大规模运行,从而节省数千美元的年度计算成本。 然而,随着芯片设计的进步,什么只能在云中运行或只能在企业数据中心运行之间的界限变得不那么清晰。

无论是出于成本、数据隐私还是数据主权的考虑,企业可能希望在其数据中心运行这些 SLM。 大多数企业不喜欢将数据发送到云端。 另一个关键原因是性能。 边缘人工智能 尽可能接近数据执行计算和推理,使其比通过云提供商更快、更安全。

值得注意的是,SLM 需要较少的计算能力,非常适合在资源受限的环境甚至移动设备上部署。

本地示例可能是 IBM Cloud® Satellite 位置,它具有与托管 LLM 的 IBM Cloud 的安全高速连接。 电信公司可以在其基站托管这些 SLM,并向其客户提供此选项。 这完全取决于优化 GPU 的使用,因为数据必须传输的距离缩短了,从而提高了带宽。

你能走多小?

回到最初的问题:能够在移动设备上运行这些模型。 移动设备可能是高端手机、汽车甚至机器人。 设备制造商发现运行 LLM 需要大量带宽。 微型法学硕士是规模较小的模型,可以在手机和医疗设备上本地运行。

开发人员使用低秩适应等技术来创建这些模型。 它们使用户能够根据独特的要求微调模型,同时保持可训练参数的数量相对较少。 事实上,GitHub 上甚至还有一个 TinyLlama 项目。

芯片制造商正在开发可以通过图像扩散和知识蒸馏运行精简版 LLM 的芯片。 片上系统 (SOC) 和神经处理单元 (NPU) 协助边缘设备运行新一代人工智能任务。

虽然其中一些概念尚未投入生产,但解决方案架构师应该考虑当今的可能性。 SLM 与 LLM 合作可能是一个可行的解决方案。 企业可以决定在其行业中使用现有的较小的专用人工智能模型,或者创建自己的模型以提供个性化的客户体验。

混合人工智能是答案吗?

虽然在本地运行 SLM 似乎很实用,而且移动边缘设备上的微型 LLM 很诱人,但如果模型需要更大的数据集来响应某些提示怎么办?

混合云计算提供了两全其美的优势。 这同样适用于人工智能模型吗? 下图展示了这个概念。

当较小的模型无法满足要求时,混合 AI 模型可以提供在公共云中访问 LLM 的选项。 启用此类技术是有意义的。 这将允许企业通过使用特定于领域的 SLM 来保证其数据在其场所内的安全,并且他们可以在需要时访问公共云中的 LLM。 随着配备 SOC 的移动设备的功能变得越来越强大,这似乎是分配生成式 AI 工作负载的更有效方式。

IBM® 最近宣布在其 Watson™ 平台上推出开源 Mistral AI 模型。 这种紧凑的法学硕士需要更少的资源来运行,但与传统的法学硕士相比,它同样有效并且具有更好的性能。 IBM 还发布了 Granite 7B 模型,作为其精心策划、值得信赖的基础模型系列的一部分。

我们的观点是,企业应该专注于利用内部企业数据构建小型的、特定领域的模型,以区分其核心能力并利用数据中的见解(而不是冒险构建自己的通用法学硕士,他们可以轻松地从多个提供商处访问这些模型) )。

越大并不总是越好

电信公司是受益于采用这种混合人工智能模型的企业的典型例子。 他们扮演着独特的角色,因为他们既可以是消费者,也可以是提供者。 类似的场景可能适用于医疗保健、石油钻井平台、物流公司和其他行业。 电信公司准备好充分利用人工智能了吗? 我们知道他们有很多数据,但是他们有适合这些数据的时间序列模型吗?

在 AI 模型方面,IBM 制定了多模型策略来适应每个独特的用例。 越大并不总是越好,因为专用模型优于基础设施要求较低的通用模型。

创建灵活的、特定于领域的语言模型 了解有关 IBM 生成式 AI 的更多信息

本文是否有帮助?

是的不

执行云架构师

分布式基础设施和网络管理研究,发明大师

Related articles

以太坊价格下跌10% – 这是购买机会吗?

以太坊价格幻灯片10% – 市场情绪变谨慎

23 6 月, 2025
Fartcoin面对11%的下降测试200 EMA支持

Fartcoin面对11%的下降测试200 EMA支持

22 6 月, 2025



Source link

Tags: 越大并不总是越好混合人工智能模式如何支持更小的语言模型
Share76Tweet47

Related Posts

以太坊价格下跌10% – 这是购买机会吗?

以太坊价格幻灯片10% – 市场情绪变谨慎

by john
23 6 月, 2025

信任的理由 严格的编辑政策,侧重于准确性...

Fartcoin面对11%的下降测试200 EMA支持

Fartcoin面对11%的下降测试200 EMA支持

by 小明 老师
22 6 月, 2025

Fartcoin的价格下跌了9.14%,...

XRP,Dogecoin和Cardano ETF接近90%的批准赔率

XRP,Dogecoin和Cardano ETF接近90%的批准赔率

by 小明 老师
21 6 月, 2025

分析师说,XRP,Dogecoin,Ca...

Dogecoin必须保留此支持,否则可能会撞到0.015美元

加密分析师预测,耗尽销售阶段后,$ 4狗蛋白

by 小明 老师
20 6 月, 2025

信任的理由 严格的编辑政策,侧重于准确性...

Dogecoin恢复60%的搬迁 – 会向上还是向下?

Dogecoin恢复60%的搬迁 – 会向上还是向下?

by 小明 老师
20 6 月, 2025

一位分析师解释了如何以60%的价格转移D...

Load More
  • Trending
  • Comments
  • Latest
比特币即将崩盘吗? 分析师指出可能出现下降趋势

分析师警告称,股价可能跌至 59,000 美元

26 4 月, 2024
LTC 可能会在新一轮飙升之前重新测试 60 美元

LTC 可能会在新一轮飙升之前重新测试 60 美元

30 3 月, 2024
DappRadar 将担任 Lisk Onchain 春季黑客马拉松评委

DappRadar 将担任 Lisk Onchain 春季黑客马拉松评委

30 3 月, 2024
DOGE 历史模式显示 1 美元即将到来,鲸鱼收购以太坊和这款 DeFi 代币

DOGE 历史模式显示 1 美元即将到来,鲸鱼收购以太坊和这款 DeFi 代币

17 12 月, 2024
LINK 价格回升,为什么 Chainlink 可能飙升超过 10%

LINK 价格回升,为什么 Chainlink 可能飙升超过 10%

30 3 月, 2024
Chainlink (LINK) 价格突破看涨旗杆,这是下一个目标

Chainlink (LINK) 价格突破看涨旗杆,这是下一个目标

30 3 月, 2024

Enterprise Ethereum Alliance Appoints First Executive Director

Opera's Crypto Browser Enters iOS, Worldcoin's Open Source, LUNA Gift + More News

Opera's Crypto Browser Enters iOS, Worldcoin's Open Source, LUNA Gift + More News

US SEC’s Proposal On 'Exchange' Definition Could Be Unconstitutional – Think Tank

US SEC’s Proposal On 'Exchange' Definition Could Be Unconstitutional – Think Tank

LTC 可能会在新一轮飙升之前重新测试 60 美元

LTC 可能会在新一轮飙升之前重新测试 60 美元

看涨势头或看跌压力会占上风吗?

看涨势头或看跌压力会占上风吗?

狗狗币价格突破三年新高

狗狗币价格突破三年新高

以太坊价格下跌10% – 这是购买机会吗?

以太坊价格幻灯片10% – 市场情绪变谨慎

23 6 月, 2025
下一次浪潮之前平静吗?

随着战争升级的火花市场抛售,比特币价格潜水

23 6 月, 2025
德克萨斯州批准国家支持的比特币储备

德克萨斯州批准国家支持的比特币储备

22 6 月, 2025
Nakamoto Holdings筹集了5150万美元的比特币储备扩展

Nakamoto Holdings筹集了5150万美元的比特币储备扩展

22 6 月, 2025
Fartcoin面对11%的下降测试200 EMA支持

Fartcoin面对11%的下降测试200 EMA支持

22 6 月, 2025
Parataxis收购了韩国生物技术公司,以推出比特币国库平台

Parataxis收购了韩国生物技术公司,以推出比特币国库平台

21 6 月, 2025

比特900财经

比特900财经

最新最快的区块链财经科普平台




比特900财经是一家专业的数字货币和区块链媒体平台,致力于为读者提供最新的加密货币新闻、区块链技术动态和市场趋势分析。我们关注比特币行情、区块链投资、智能合约等热门话题,并提供加密货币ICO和数字货币钱包等方面的深入解读。通过我们权威的区块链监管政策报道和专业的加密货币市场分析,帮助读者了解行业趋势,做出明智的投资决策。





Categories tes

  • 7×24
  • Altcoin(ALT)
  • Cardano(ADA)
  • Chainlink(LINK)
  • DeFi
  • Dogcoin
  • Litecoin(LTC)
  • NFT
  • Ripple(XRP)
  • Web 3
  • Zcash (ZEC)
  • 交易所
  • 以太坊(ETH)
  • 区块链
  • 市场行情
  • 技术创新
  • 比特币(BTC)
  • 法律合规
  • 深度观察

Tags

ADA BlockDAG BTC Cardano Coin Coinbase Dapp DappRadar Dapps DeFi DOGE ETF ETH Finance Inu Labs Meme Memecoin Network NFT PEPE Polygon Qubetics Ripple SEC SHIBA SOL Solana SUI Web3 XRP 万美元 与 亿美元 什么是 代币 区块链新闻观点电视和工作 和 在 年 月 比特币 的 美元 随着

近期文章

  • 以太坊价格幻灯片10% – 市场情绪变谨慎
  • 随着战争升级的火花市场抛售,比特币价格潜水
  • 德克萨斯州批准国家支持的比特币储备
  • Nakamoto Holdings筹集了5150万美元的比特币储备扩展
  • Fartcoin面对11%的下降测试200 EMA支持
  • 关于我们
  • FAQ
  • 联系我们

© 2024 Bit900 - support By Pangoo

No Result
View All Result
  • 首页
  • 7×24
  • 市场行情
    • 比特币(BTC)
    • 以太坊(ETH)
    • Litecoin(LTC)
    • Ripple(XRP)
    • Dogcoin
    • Altcoin(ALT)
    • Cardano(ADA)
    • Chainlink(LINK)
    • Zcash (ZEC)
    • EOS
  • 交易所
  • 区块链
  • 深度观察
  • 技术创新
  • NFT
  • Layer 2
  • Web 3
  • DeFi
  • 深度观察

© 2024 Bit900 by Bit900.