SiliconCloud上线Reflection-Llama-3.1-70B

9 月 9 日
阅读 2 分钟
204
9月6日,AI写作初创公司HyperWrite推出了Reflection-Llama-3.1-70B,这是一个基于Llama-3.1-70B-Instruct的开源大语言模型,其显著特性是自我修正能力,使用的Reflection-Tuning技术使模型能够识别并修正自己的错误与幻觉,显著提高其准确性和可靠性。

硅基流动荣登《中国企业家》杂志2024年最具成长潜力人工智能公司

9 月 8 日
阅读 1 分钟
200
据悉,今年的“新锐100”企业名单聚焦在成立不超过5年,估值在5亿元人民币以上或融资轮次在天使轮及以上的初创型公司,希望找到其中最有潜力成长壮大的“种子”公司。《中国企业家》杂志通过网络征集、投资机构及专业组推荐、第三方数据公司、其他公开渠道收集等方式,以公司估值、融资轮次、营业收入等客观数据为主要依据,...

SiliconCloud API支持JSON模式,强化内容结构化输出

9 月 5 日
阅读 2 分钟
213
目前,硅基流动的大模型API平台SiliconCloud默认生成非结构化文本,但在某些应用场景中,你可能希望模型以结构化形式输出内容,但通过提示词的方式直接告诉大模型无法获得正确的结构化输出。

硅基花样流动 | SiliconCloud 产品体验魔法师奖公布!

9 月 3 日
阅读 2 分钟
253
在此次活动中,我们收到了近 200 篇的合格投稿内容,见证了众多体验达人们的出色技术与创意,并从内容完整度、产品创新体验等多方面,评选出了 21 篇精品内容,发放“体验魔法师奖”。

硅基流动成立这一年

9 月 2 日
阅读 9 分钟
465
(以下文章来源于公众号【智能涌现】 ,作者邓咏仪)​8月29日是硅基流动成立一周年的日子。​此时,从清华科技园出发,我们正踏上秋游的列车,驶往目的地。创业多年,我们拥有了一次集体休整的机会。最重要的是,新产品上线获得的阶段性成果给了我们巨大的宽慰。尽管我们做了深入调研与分析,但当真正意义上的产品Silicon...

SiliconCloud API实战攻略:手把手教你配置OneAPI、LobeChat、MindSearch

8 月 28 日
阅读 5 分钟
1.4k
​SiiconCloud是硅基流动推出的大模型云服务平台,通过集成SiiconCloud API,开发者和企业可以轻松地使用SiiconCloud平台上的大模型服务,以实现各种生成式AI相关的任务和功能,推动业务创新和增长。

硅基流动荣登“2024年AIGC创新企业及产品创新”榜单

8 月 26 日
阅读 2 分钟
171
8月22日,国际创新生态服务平台创业邦发布了《2024 AIGC年度榜单》(创新企业榜单、产品创新榜单),硅基流动荣登“2024年AIGC创新企业100强”榜单,SiliconCloud大模型云服务平台作为荣登“2024年AIGC产品创新100强”榜单。据悉,本次评选主要采用内部初审+10位投资机构的专家评委评审的模式,创业邦对申报企业和产品进行数...

SiliconCloud x 捏Ta:10倍提效C端大规模内容生成

8 月 22 日
阅读 2 分钟
215
通过对比多种不同的大模型API并对AI推理加速方案进行A/B实验,捏Ta团队最后选择将硅基流动的大模型API服务平台SiliconCloud和图片/视频推理引擎OneDiff引入其核心技术栈。

SiliconCloud上线Qwen2-Math-72B-Instruct:让最强数学模型加速解题

8 月 15 日
阅读 3 分钟
364
​此前,硅基流动的大模型API服务平台SiliconCloud上线了阿里开源的Qwen2系列的72B、57B以及两款可免费使用的模型7B、1.5B模型。

SiliconCloud上线InternLM2.5-20B-Chat,复杂场景推理能力全面增强

8 月 14 日
阅读 2 分钟
315
此前,硅基流动的大模型API服务平台SiliconCloud上线了上海人工智能实验室开源的InternLM2.5-7B-Chat(免费使用)。今天,SIliconCloud正式上线推理加速后的新版本InternLM2.5-20B-Chat,其综合性能更为强劲,可以有效支持更加复杂的实用场景,接入MindSearch多智能体框架后能自主进行互联网搜索并从上百个网页中完成信...

集齐RAG三要素,SiliconCloud上线Reranker、Embedding模型BCE与BGE

8 月 13 日
阅读 3 分钟
640
为了方便开发者使用检索模型构建RAG(Retrieval Augmented Generation,检索增强生成),今天,SIliconCloud正式上线由网易有道开源的Embedding模型bce-embedding-base_v1和Reanker模型bce-reranker-base_v1,以及由智源研究院开源的Embedding模型bge-m3,与Reranker模型BAAI/bge-reranker-v2-m3。

如何准确且可解释地评估大模型量化效果?

8 月 12 日
阅读 6 分钟
650
随着Llama 3.1的发布,关于不同量化方法的优缺点的讨论变得相当热烈。模型量化质量的评估一向是个难题,本文将分享Fireworks如何处理量化以及评估其中的权衡。

前OpenAI联创、ChatGPT负责人John Schulman:大模型的升级秘诀

8 月 9 日
阅读 13 分钟
683
8月6日,OpenAI联合创始人、ChatGPT架构师John Schulman宣布离职,将加入另一家由前OpenAI员工Dario Amodei创办的大模型公司Anthropic。
封面图

硅基花样流动 | SiliconCloud 产品体验官招募开启!

8 月 7 日
阅读 2 分钟
183
亲爱的开发者们,你是否在 SiliconCloud 体验过那种“哇哦,这也太酷了吧!”的感觉?或者用它实现了惊艳的项目,想要分享给全世界?​
封面图

SiliconCloud上线Llama-3.1-405B:让开发者走进GPT4时代

8 月 6 日
阅读 2 分钟
258
一如既往,SiliconCloud平台快速支持了Llama-3.1-8B(可免费使用)、Llama-3.1-70B模型。今天,Llama-3.1-405B大模型正式在SiliconCloud平台上线,用户在实名认证后可用。API调用文档:
封面图

超越SD3,比肩MJ v6,SiliconCloud上线FLUX.1

8 月 6 日
阅读 3 分钟
399
一如既往,为了让用户快速体验到推理加速版的最新开源图片生成模型,硅基流动团队旋即在SiliconCloud上线了FLUX.1 [dev]与FLUX.1 [schnell],目前可免费试用。

AI搜索Perplexity的产品构建之道

8 月 5 日
阅读 6 分钟
337
作为一家刚成立不到两年的新公司,AI搜索新星Perplexity与搜索巨头Google和AI先锋OpenAI展开竞争,争夺未来搜索领域的一席之地。目前,Perplexity已经拥有数以千万计的用户,不过,该团队的成员还不到50人。更令人振奋的是,这个年轻团队已经实现了超过2000万美元的年度经常性收入(ARR)。

Token 不够用?邀请好友注册给你满上!

8 月 2 日
阅读 1 分钟
174
SiliconCloud 上线两月有余,好多朋友都反馈玩得不亦乐乎,以及...还想要更多 Tokens 😄好嘞,安排~~全新的邀请活动现已上线!8 月 1 日起,每成功邀请一位 SiliconCloud 新用户,双方均可获得 2000 万 Tokens。邀请奖励上不封顶 ( ̄︶ ̄)↗ 只要人脉到位,你的 Token 就能轻松满上 :)

BizyAir 上新!无需显卡也可玩转最新版 Kolors

8 月 2 日
阅读 2 分钟
448
相信对很多图像创意工作者来说,ComfyUI 的易用高效和 Kolors 的强强联合,无疑是一对完美的搭档。然而,硬件资源短缺却是绕不开的难题。

SiliconCloud x 沉浸式翻译:让100万用户享受免费大模型的极速翻译服务

7 月 31 日
阅读 2 分钟
1.8k
昨天,硅基流动的SiliconCloud正式成为沉浸式翻译官方接入的首个大模型云服务平台。用户可在沉浸式翻译的“翻译服务”中直接选择SiliconCloud,无需自主配置API就可免费使用8款大模型,获得比传统翻译模型更高质量、更高性能的翻译体验。

AI Scaling的神话

7 月 26 日
阅读 5 分钟
171
本文作者认为,这种观点来自于一系列神话和误解。从表面上看,规模扩展(Scaling)具有可预测性,但这是对研究成果的误解。此外,有迹象表明,LLM开发者已经接近高质量训练数据的极限。而且,模型行业正面临着模型尺寸的强烈下行压力。虽然现在无法准确地预测AI通过扩展能取得多大进展,但作者认为仅靠扩展几乎不可能实...
封面图

免费模型最高速率提升10倍!SiliconCloud分层限速开启公测

7 月 24 日
阅读 2 分钟
451
今天,硅基流动团队推出SiliconCloud分层限速方案,并开启公测(7月24日至7月31日),以此为用户提供更优质服务与使用体验。以下是SiliconCloud新版限速方案的三大亮点:六种用量级别:用得越多,可用最大速率越高新方案设置了六种用量级别的分层速率,通过RPM( Requests Per Minute ,每分钟请求次数)、TPM( Tokens ...
封面图

张实、曾华加入硅基流动,任联合创始人

7 月 23 日
阅读 2 分钟
358
张实,硅基流动联合创始人,前港股上市公司医渡科技集团执行董事、高级副总裁,前医渡云董事长,曾在微软负责政府事务及医疗行业以及在惠普和戴尔等多家跨国企业工作。她拥有卓越的商业洞察力,曾探索出诸多创新性商业模式并推动落地,在全球范围内建立了广泛的客户和合作伙伴网络,在每家公司都做出了突出业绩与贡献。

硅基流动 x Spark Lab:加速年轻梦想家的AI产品落地

7 月 22 日
阅读 1 分钟
270
近日, 硅基流动与Spark Lab达成合作,将为Spark Lab Program的项目提供AI算力支持,提供更快、更便宜、更全面的主流大模型API服务,助力AI产品加速落地。

生成式AI推理企业的市场机遇、竞争与未来

7 月 18 日
阅读 6 分钟
327
在生成式人工智能时代的投资选择中,风投公司对“铲子型”初创企业的浓厚兴趣,这些企业的业务涵盖了模型微调、可观测性分析、以及人工智能的“抽象化”服务(例如,将AI Inference作为服务)等。人们预测,随着初创公司和企业将人工智能技术纳入其产品组合,他们可能不愿意或无法在内部构建这些技术能力,因此更倾向于购买...

BizyAir云节点上线ControlNet Union:十多种图像输入控制,一个模型就够了

7 月 17 日
阅读 2 分钟
308
今天,硅基流动开源的ComfyUI BizyAir正式上线ControlNet节点,包括ControlNet Union以及24个ControlNet Preprocessing节点。此前,BizyAir云节点已上线SiliconCloud LLM、可图Kolors。

SiliconCloud上线两款Embedding模型BGE-Large

7 月 16 日
阅读 2 分钟
454
今天,SiliconCloud正式上线Embedding模型BAAI/bge-large-zh-v1.5、BAAI/bge-large-en-v1.5,支持最大token长度均为512 token,batch size最大为 32。目前,这两款模型可免费使用。
封面图

比肩Midjourney-v6!没有GPU也能跑可图Kolors

7 月 16 日
阅读 2 分钟
226
比肩Midjourney-v6,快手的文生图开源模型可图Kolors一发布,开源社区就炸开了锅。短短几天,可图在Github上收获2k Star,Huggingface模型下载热榜第一。
封面图

硅基流动完成近亿元融资:加速生成式AI技术普惠进程

7 月 11 日
阅读 3 分钟
354
硅基流动(SiliconFlow)近日完成总金额近亿元人民币的天使+轮融资。本轮融资由某知名产业方领投,跟投方包括智谱AI、360 和水木清华校友基金等知名企业及机构,老股东耀途资本继续超额跟进,华兴资本担任独家财务顾问。

国产大模型新标杆!比肩GPT4,DeepSeek V2重磅升级

7 月 11 日
阅读 2 分钟
2.4k
近日,深度求索团队更新了DeepSeek-V2模型,新版本DeepSeek-V2-Chat模型推理能力有了极大提升。尤其在数学解题、逻辑推理、编程、指令跟随、Json格式输出不同维度上,最高有16%的性能提升。