一文了解AI创业公司MiniMax
科技
科技 > 互联网 > 正文

一文了解AI创业公司MiniMax

一、引言

1.1 研究背景与目的

MiniMax 成立于 2021 年 12 月,专注于大模型的研发,迅速构建起文本、语音、音乐、图像和视频等多模态大模型,并打通了产品全链路。其在 AI 技术研发与应用落地方面取得的显著进展,不仅为行业发展注入了新的活力,也为用户带来了诸多创新体验。

二、MiniMax 公司全景剖析

2.1 公司发展历程回溯

MiniMax 成立于 2021 年 12 月,彼时人工智能领域正处于技术突破的前夜,在 ChatGPT 还未发布,OpenAI 也不温不火,而商汤也即将上市的背景下,闫俊杰毅然离开商汤,创立了 MiniMax 稀宇科技,名字源于极小化极大算法,旨在找出失败的最大可能性中的最小值,这一理念也贯穿了公司的发展历程。

2022 年,公司取得了重要进展,10 月推出了第一款产品 Glow,这款产品聚焦于 AI 聊天功能,允许用户创建属于自己的智能体,并通过设定人物背景、性格、价值观等特征,以及后续的对话训练,来调整智能体的语气、说话方式等。Glow 上线仅 4 个月,用户就已接近 500 万 ,在年轻人中掀起了一阵热潮,成功让 MiniMax 进入大众视野。

然而,2023 年 3 月,由于备案问题,Glow 在国内被下架。面对这一挫折,MiniMax 迅速调整战略,将目光投向海外市场,并于 2023 年 6 月成功推出 Talkie。Talkie 是 Glow 在海外的复制版本,主要面向北美市场,上架于海外 Google Play 和 Apple Store 双端。凭借其出色的 AI 角色定制功能,用户可以在平台上自由创建特色 AI 智能体,通过调整外貌、语音、性格等多方面,打造专属陪聊对象,同时还解决了传统 AI 语音生硬的问题,大大提升了用户的聊天沉浸感。此外,Talkie 还创新性地加入了卡牌收集和交易玩法,进一步增强了用户的参与度和粘性。截至 2024 年 6 月,Talkie 在美国 AI 类应用下载量排名第五位,今年以来至 6 月美国市场累计下载 380 万次,AI 类排名第四位,AI 伴侣类排名第一,超过了 Character.AI 一倍以上,全球月活数据达到 1100 万 ,其中超一半用户来自美国,在全球范围内取得了显著的市场成绩。

在国内市场,2023 年 9 月,MiniMax 在 Glow 下架 6 个月后,成功推出 AI 伴侣产品星野。星野基于全球领先的多模态 AIGC 技术,是一个支持用户自由创造和分享 AI 智能体的内容社区,为用户提供了丰富的情绪价值。用户可以根据自身喜好,自由定制 AI 智能体的形象、声音、人设和技能,并通过后续对话不断强化和调整,使其更符合自己的期望。星野在国内市场表现出色,在 Apple Store 社交类应用下载排名第 26 位,成为国内 AI 伴侣应用的佼佼者。根据量子位智库发布的《中国 AI 陪伴产品 6 月数据报告》,星野 2024 年上半年下载量约为 900 万次,与第二名及之后的产品拉开了较大差距 。在活跃度方面,2024 年 6 月,星野 DAU 略低于 50 万,在 AI 伴侣产品中占据绝对领先优势。

除了 AI 伴侣产品,MiniMax 还积极拓展其他业务领域。公司自主研发了多模态的通用大模型,包括万亿参数的 MoE 文本大模型、语音 & 音乐大模型、图像大模型以及视频大模型 。基于这些强大的大模型,MiniMax 推出了生产力工具海螺 AI,为用户提供高效的信息搜索、办公辅助等服务,帮助用户提升工作效率。同时,公司还打造了 MiniMax 开放平台,为企业和开发者提供安全、灵活、可靠的 API 服务,助力他们快速搭建 AI 应用,进一步拓展了公司在 AI 领域的业务版图。

在融资方面,MiniMax 也取得了显著成果,腾讯、米哈游、IDG 资本、高瓴都曾对其进行投资。2024 年 3 月,阿里巴巴领投了 MiniMax 最新的一轮融资,金额据称超过 6 亿美元,这使得 MiniMax 的估值攀升至 25 亿美元 ,充分显示了资本市场对公司发展前景的高度认可。

2.2 核心团队与组织架构解析

MiniMax 的核心团队实力雄厚,成员大多来自商汤,具备丰富的人工智能领域经验与专业知识。

闫俊杰:作为 MiniMax 的创始人兼 CEO,闫俊杰毕业于中国科学院自动化研究所,拥有深厚的学术背景。在商汤科技任职期间,他担任副总裁、研究院副院长以及通用智能技术负责人等重要职务,全面负责搭建深度学习的工具链和底层算法,对通用智能的技术发展进行了深入的探索与规划。他主导搭建的商汤人脸识别和智慧城市相关的技术体系,在实际应用中取得了显著成效。此外,闫俊杰在深度学习和计算机视觉领域成果丰硕,发表顶级会议和期刊论文 100 余篇,Google Scholar 引用超过 10000 次,其卓越的学术造诣和技术领导力为 MiniMax 的发展奠定了坚实基础。

周彧聪:联合创始人周彧聪毕业于北京航空航天大学,是商汤科技的早期员工之一。在商汤科技研究院,他主管算法团队,展现出了出色的团队管理与技术指导能力。在学生时代,周彧聪就展现出了非凡的实力,分别在世界大学生超级计算机竞赛 ASC15 总决赛和国际超级计算机大会 ISC17 中荣获第一。他还参加过国际计算机视觉大会 ICCV 2019 挑战赛,所在团队在 iQIYI - Large 赛道夺冠,周彧聪在其中负责整个训练平台的建设和维护,为团队的成功发挥了关键作用。

杨斌:技术合伙人杨斌同样毕业于中科院自动化所,曾就职于 Uber AI 研究院,在自动驾驶卡车领域积累了多年的研发经验。他对基于数据驱动的端到端无人卡车运输问题有深入的研究,其专业技术能力为 MiniMax 在相关技术领域的探索提供了有力支持。

三、MiniMax 技术实力深探

3.1 多模态通用大模型技术架构

MiniMax 自主研发的多模态通用大模型技术架构,融合了文本、语音、音乐、图像和视频等多种模态,展现出卓越的综合性与创新性。其万亿参数的 MoE 文本大模型,采用混合专家模型(MoE)架构,将复杂任务分解为多个子任务,由不同的专家网络分别处理。这种架构就如同一个分工明确的团队,每个成员专注于自己擅长的领域,从而在处理复杂语言任务时实现更高的效率与准确性。相比传统的稠密模型,MoE 模型在稀宇科技开发的 abab - text - 6.5s 大语言模型中,速度提升了 3 - 5 倍,每天能够处理几十亿次交互,充分彰显了其强大的性能优势。

在语音与音乐大模型方面,MiniMax 利用长达数百万小时的高质量音频数据进行训练,使模型性能得到显著提升。其语音大模型不仅能够生成多种语言的合成语音,如普通话、粤语、日语、韩语、西班牙语等,而且拟人度高,情绪变化细腻自然,效果可与 ElevenLabs 和 OpenAI 相媲美。音乐大模型则支持多功能端到端音乐生成,可用于合成纯音乐、清唱作品等多种音乐形式,还能满足伴奏与人声同时生成的需求,为音乐创作带来了极大的便利,即使是没有专业音乐背景的人也能轻松进行音乐创作。

图像与视频大模型同样表现出色。图像大模型具备强大的图像生成与理解能力,能够根据文本描述生成高质量的图像,并且在图像分类、目标检测等任务中展现出较高的准确率。视频大模型 abab - video - 1 更是引人注目,它支持原生高分辨率和高帧率视频生成,具有压缩率高、文本响应好的特点,生成的视频画面流畅、情节丰富,可媲美电影质感。例如,在生成一些科幻、魔幻主题的视频时,能够通过细腻的画面和生动的情节,为观众带来沉浸式的视觉体验 。

3.2 核心技术创新点与突破

MiniMax 在技术研发过程中,取得了多项核心技术创新点与突破,为其在人工智能领域的发展奠定了坚实基础。

在自然语言处理领域,MiniMax 通过持续的研究与实验,对模型架构和算法进行了深度优化。公司创新性地采用了 Linear Attention(线性注意力)机制,成功打破了传统模型架构中输入长度和计算复杂度之间的平方增长关系,将其转变为线性关系。这一突破使得模型在处理长文本时,能够以更高效的方式进行计算,极大地提升了长文本处理效率,为实现无限长的输入和输出迈出了关键一步。例如,在处理长篇小说、学术论文等长文本时,MiniMax 的大模型能够快速准确地提取关键信息、总结核心内容,为用户提供高质量的文本分析服务。

为了降低大模型的错误率,提高模型在实际应用中的可靠性,MiniMax 投入了大量资源进行技术攻关。通过改进训练算法、增加训练数据的多样性和质量等方式,不断优化模型的性能。经过持续努力,其研发的大模型在错误率控制方面取得了显著成效,向着将错误率降低至 2% - 3% 的目标稳步迈进。这使得 MiniMax 的大模型能够在一些对准确性要求极高的场景中得到应用,如金融分析、医疗诊断等领域的信息处理与辅助决策 。

在多模态融合技术方面,MiniMax 也实现了重要突破。公司成功地将文本、语音、图像、视频等多种模态的信息进行有机融合,使模型能够更加全面、准确地理解和处理复杂的信息。例如,在一个智能客服场景中,用户不仅可以通过文字与客服进行交流,还可以发送图片或语音描述问题,MiniMax 的多模态大模型能够综合这些信息,快速理解用户需求,并给出准确、全面的回答。这种多模态融合技术,大大拓展了大模型的应用场景和能力边界,为用户带来了更加丰富、便捷的交互体验。

四、MiniMax 产品与应用场景详析

4.1 主要产品体系概述

海螺 AI 是一款功能强大的生产力工具,背后接入了 MiniMax 自研的多模态大模型,包括万亿参数 MoE 大语言模型 abab6.5、语音大模型和图像大模型。该产品支持输入 200k tokens 的上下文长度,能在 1 秒内处理近 3 万字的文本,具备强大的长文本处理能力。它可以快速提炼论文、财报、纪要、书籍要件的关键信息并进行归纳总结,为用户节省大量阅读时间。海螺 AI 支持语音交互,提供多种自然的语音选项,方便老人、小孩和视障人士使用。无论是在花鸟市场询问绿植价格,还是与思维跳跃的小孩子聊天,海螺 AI 都能展现出良好的理解能力和反应速度,还能帮助用户练习口语,模拟咖啡馆场景互动或大厂面试环节,引导用户展开话题 。

星野是国内领先的沉浸式 AI 内容社区,基于全球领先的多模态 AIGC 技术,为用户提供了丰富的情绪价值。用户在星野中拥有高度的自主性,能够根据个人喜好自由定制 AI 智能体的形象、声音、人设和技能。通过与智能体的持续对话,用户可以不断强化和调整智能体的表现,使其更贴合自己的期望。星野 App 进入 2.0 Live 时代后,依托海螺 AI 视频模型,实现了诸多功能升级。用户与 AI 智能体聊天时,能触发其微笑、害羞、牵手等动态 live 效果,还能上传自己的照片与智能体合拍视频。这些功能让用户与智能体的互动更加真实、立体和沉浸,仿佛与真人交流无异。此外,星野还具备模型自由选择、动态全平台分享、bgm 音量调节以及创作中心的 “一句话捏同款” 等丰富功能,为用户带来了多元且便捷的创作和互动体验 。

4.2 不同行业应用案例展示

4.2.1 金融行业

在金融行业,风险评估和市场预测是至关重要的环节。MiniMax 的 AI 技术能够收集和分析海量的金融数据,包括历史股价、宏观经济指标、公司财务报表等。通过对这些数据的深度学习和分析,AI 系统可以构建精准的风险评估模型,对投资项目的风险进行量化评估,为金融机构的投资决策提供有力支持。例如,在评估一项新的投资项目时,MiniMax 的 AI 系统可以快速分析项目的市场前景、行业竞争态势、财务状况等因素,准确预测项目可能面临的风险,并给出相应的风险应对建议。

在市场预测方面,MiniMax 的 AI 技术可以综合考虑各种因素,如政治局势、经济政策、市场情绪等,对股票市场、外汇市场等金融市场的走势进行预测。通过对大量历史数据和实时信息的分析,AI 系统能够发现市场变化的规律和趋势,提前预测市场的波动,帮助投资者把握投资时机,降低投资风险。例如,在股票市场中,AI 系统可以根据对宏观经济数据、行业动态以及公司基本面的分析,预测某只股票的价格走势,为投资者提供买卖决策的参考 。

4.2.2 医疗行业

在医疗领域,疾病诊断和治疗方案制定是关键环节,MiniMax 的 AI 技术为医疗行业带来了诸多创新应用。在疾病诊断方面,AI 可以通过对患者的病历、影像资料(如 X 光、CT、MRI 等)、生理指标等数据的分析,辅助医生进行疾病的诊断。例如,对于肺部疾病的诊断,MiniMax 的 AI 系统可以快速分析肺部影像,识别出肺部的病变区域,并判断病变的性质(如良性或恶性),为医生提供诊断参考。AI 还可以对大量的医学文献进行分析,帮助医生了解最新的疾病研究成果和诊断标准,提高诊断的准确性和及时性 。

在治疗方案制定方面,AI 可以根据患者的病情、身体状况、基因数据等信息,为医生提供个性化的治疗方案建议。以肿瘤治疗为例,AI 系统可以分析患者的肿瘤类型、分期、基因突变情况等因素,结合临床研究数据和治疗经验,为医生推荐最合适的治疗方法,如手术、化疗、放疗、靶向治疗或免疫治疗等,并给出治疗的剂量和疗程建议。AI 还可以通过对患者治疗过程中的数据监测,实时调整治疗方案,以达到最佳的治疗效果 。

4.2.3 教育行业

在教育行业,MiniMax 的 AI 技术为实现个性化学习和智能辅导提供了有力支持。通过对学生的学习数据(如学习成绩、学习习惯、学习兴趣等)的分析,AI 可以了解每个学生的学习状况和特点,为学生制定个性化的学习计划。例如,对于数学学习困难的学生,AI 系统可以根据学生在各个知识点上的掌握情况,有针对性地推荐学习资料和练习题,帮助学生巩固薄弱环节,提高学习成绩。AI 还可以根据学生的学习进度和能力,动态调整学习计划,确保学习计划的有效性和适应性 。

在智能辅导方面,AI 可以充当学生的智能学习伙伴,随时解答学生的问题。无论是在学习过程中遇到的难题,还是对知识点的疑惑,学生都可以向 AI 提问,AI 会以清晰、易懂的方式为学生提供解答。AI 还可以通过与学生的互动,了解学生的学习思路和问题所在,给予针对性的指导和建议,帮助学生培养良好的学习方法和思维能力。例如,在英语学习中,AI 可以与学生进行口语对话练习,纠正学生的发音错误,提高学生的口语表达能力 。

五、MiniMax 市场表现与发展现状

5.1 市场份额与用户增长趋势

以其 AI 伴侣产品为例,Talkie 在全球范围内取得了显著成绩,全球月活数据达到 1100 万,其中超一半用户来自美国,在美国 AI 类应用下载量排名中表现出色,今年以来至 6 月美国市场累计下载 380 万次,AI 类排名第四位,AI 伴侣类排名第一,超过了 Character.AI 一倍以上 。这一成绩不仅彰显了 Talkie 在 AI 伴侣领域的领先地位,也反映出 MiniMax 在全球市场的影响力不断扩大。

在国内市场,星野同样表现亮眼。根据量子位智库发布的《中国 AI 陪伴产品 6 月数据报告》,星野 2024 年上半年下载量约为 900 万次,在 Apple Store 社交类应用下载排名第 26 位,在 AI 伴侣应用中与第二名及之后的产品拉开了较大差距。在活跃度方面,2024 年 6 月,星野 DAU 略低于 50 万,在 AI 伴侣产品中占据绝对领先优势。这些数据表明,星野在国内 AI 伴侣市场中深受用户喜爱,拥有庞大的用户基础和较高的用户活跃度。

海螺 AI 作为 MiniMax 的生产力工具,也在市场中崭露头角。其海外版月访问量增长迅猛,同比增长高达 2772.92%,在 10 月登顶 AI 产品榜・全球增速榜,月访问量达 1173 万 。这一数据充分展示了海螺 AI 在海外市场的受欢迎程度和强大的市场潜力。在国内市场,虽然相关数据相对较少,但从其功能特点和技术优势来看,海螺 AI 有望在生产力工具市场中获得更多用户的认可,进一步拓展市场份额。

5.2 融资历程与估值变化

在 2022 年,MiniMax 获得了云启资本的天使轮投资,这为公司的初创阶段注入了关键资金,助力其搭建技术团队和开展早期研发工作。同年 7 月,Pre-A 轮融资吸引了米哈游、高瓴创投、明势资本、IDG 等头部玩家的加入,融资完成后公司估值约 5 亿美元。这些知名投资机构的参与,不仅为 MiniMax 带来了充足的资金,还凭借其丰富的行业资源和经验,为公司的发展提供了宝贵的指导和支持。

2023 年 6 月,MiniMax 完成了 2.5 亿美元的 A 轮融资,公司估值飙升至 12 亿美元,其中腾讯在该轮融资中豪掷 4000 万美元。这轮融资标志着 MiniMax 在技术研发和产品应用方面取得了显著进展,得到了更多资本市场的关注和认可。腾讯的大额投资,也进一步凸显了 MiniMax 在 AI 领域的独特价值和发展潜力,双方的合作有望在技术、产品和市场等多个方面实现协同发展。

2024 年 3 月,MiniMax 完成了 B 轮融资,由阿里巴巴领投,融资额据称超过 6 亿美元,此次融资后公司估值攀升至 25 亿美元。阿里巴巴的领投,不仅为 MiniMax 带来了巨额资金,还将借助阿里巴巴在云计算、电商、大数据等领域的强大资源和平台优势,助力 MiniMax 加速技术创新、拓展业务版图、提升市场竞争力。

、结论与建议

6

.1 研究结论总结

MiniMax 在成立后的短短几年内,在人工智能领域取得了显著的发展成果。其在技术研发方面表现卓越,自主研发的多模态通用大模型技术架构融合了文本、语音、音乐、图像和视频等多种模态,展现出强大的综合处理能力。通过一系列核心技术创新,如采用 Linear Attention 机制提升长文本处理效率、降低大模型错误率等,在技术层面实现了多项突破。

在产品与应用方面,MiniMax 构建了丰富多元的产品体系。星野和 Talkie 作为 AI 伴侣产品,分别在国内和国际市场取得了出色的成绩,凭借独特的智能体定制功能和沉浸式交互体验,吸引了大量用户,拥有庞大的用户基础和较高的活跃度。海螺 AI 作为生产力工具,其强大的长文本处理能力、智能搜索、创作文案等功能,以及多模态的交互体验,在市场中崭露头角,海外版月访问量增长迅猛。此外,MiniMax 的技术和产品在金融、医疗、教育等多个行业得到了广泛应用,为各行业的发展带来了新的机遇和变革。

在市场表现上,MiniMax 已成功占据一定的市场份额,并呈现出强劲的增长态势。其融资历程顺利,获得了众多知名投资机构的支持,估值不断攀升,反映了资本市场对其发展潜力的高度认可。

然而,MiniMax 也面临着诸多挑战。技术层面,数据隐私与安全、算法可解释性等问题亟待解决;市场竞争方面,来自国际和国内科技巨头以及众多竞品的竞争压力较大;伦理与社会层面,需要应对就业替代、算法偏见等问题。

展望未来,MiniMax 在技术研发上有望继续在降低模型错误率、实现无限长输入输出以及多模态路线发展等方向取得突破。在产品与业务拓展方面,将对现有产品进行持续迭代升级,并积极拓展新的业务领域和产品。在市场前景上,无论是国内还是国际市场,都具有广阔的发展空间和潜在机遇 。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载