查看原文
其他

SiliconCloud 模型微调及服务托管能力上线ing,抢先体验报名开放,速来!

SiliconCloud 硅基流动
2024-09-30
一直以来,SiliconCloud 希望能打造“大模型 Token 工厂”,通过提供更快、更全面的主流开源大模型 API 服务,帮助开发者和企业聚焦产品创新,无须担心产品大规模推广所带来的高昂算力成本。过去的几个月,我们不断丰富模型种类及数量,从最初的文生文、文生图模型,扩展到如今的大语言模型、向量&重排序模型、包含图片/视频生成的多模态大模型,让用户可自由切换适合不同应用场景的模型。在这一过程中,我们也收到了许多用户的“自定义”需求。好的,安排!今日,大家千呼万唤的模型部署能力,已整装待发~

文末二维码可直达抢先体验报名表!



专为大模型微调与托管打造的一站式服务



依托于该项新能力,用户可以快速、无缝地将自定义模型部署为服务,并根据自己上传的数据进行模型微调,提升模型对特定业务场景的表现。现阶段平台支持两类模型的自定义:语言模型、生图模型。

除了可以享受到模型微调与托管的一站式服务,用户还能按需调整服务规模,确保灵活性和高性价比的同时,保持模型的高效运行。



4 大核心优势,满足你的多重业务需求



1. 大模型高效推理加速:基于 SiliconCloud 核心引擎,用户可以自主选择是否启用加速选项。相比未加速状态,大语言模型的时间延迟最高降低 2.7 倍,文生图模型的推理速度最快提升 3 倍。

  

2. 服务按需自动缩扩容:
  • 快速启动:通过对容器分配、镜像拉取、模型下载和服务启动的极致优化,服务冷启动时间缩短至分钟级,保证业务高效上线。
  • 动态缩扩容:支持按需自动调整服务规模,确保在负载高峰时快速扩展实例,负载减少时缩减资源,帮助用户进一步降低总拥有成本。

3. 支持微调到托管的全流程:打通从模型微调到模型部署服务的全链路,用户可直接托管经过微调的大语言模型,在支撑业务迭代的同时,无需关注底层资源、服务质量,有效降低维护成本。

4. 极致性价比:延续了 SiliconCloud 一贯的价格竞争力优势,提供最具性价比的服务。



抢先体验报名



该服务目前尚未在 SiliconCloud 平台全面开放,但我们欢迎所有对该服务感兴趣的小伙伴报名参与抢先体验!

扫码填写报名表单,以便我们更好地了解您的需求。

我们会在收到表单后的 3 个工作日内回复,届时还将提供更详细的服务信息。

报名开放至 10 月 25 日,期待大家的积极参与!点击阅读原文,查看更多详情

继续滑动看下一个
硅基流动
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存