苹果推出300亿参数多模态AI大模子MM1.5,可识别UI界面推理应然讲话
2024-10-16该版块模子提供10 亿-300亿多种参数规模,领有图像识别和当然讲话推理才气。点击收听本新闻听新闻 IT之家 10 月 13 日讯息,苹果公司现已为旗下多模态大模子 MM 推出 1.5 版块,该版块模子基于前代 MM1 的架构,链接接续数据运转的历练原则,要点相干在不同历练周期中羼杂不同类型数据对模子性能的影响。 现在关系模子文档已发布于 Hugging Face 上,IT之家附论文地址如下(点此走访)。 该版块模子提供 10 亿-300 亿多种参数规模,领有图像识别和当然讲话推理才气。苹果公司
马斯克xAI展示首个多模态模子Grok-1.5V:可将经过图转成Python代码
2024-04-14Grok-1.5V不仅能一语气文本,还能科罚文档、图表、截图和相片中的本色。 IT之家 4 月 13 日音信,马斯克旗下东谈主工智能公司 xAI 于 3 月下旬推出 Grok-1.5 诳言语模子之后,近日再次推出首个多模态模子 Grok-1.5 Vision。 xAI 暗示将于近期邀请早期测试者和现存的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能一语气文本,还能科罚文档、图表、截图和相片中的本色。 xAI 暗示:“Grok-1.5V 在多学科推理、文档一语气