生数科技｜产业级多模态大模型厂商

创建于 2024-12-30

生数科技成立于2023年3月，由安全可控人工智能方案提供商瑞莱智慧RealAI、蚂蚁集团和BV百度风投联合孵化，致力于成为全球领先的生成式人工智能基础设施及应用建设者。

数据来源：企名片quickin

公司基于自研产业级多模态大模型，面向图像创作、3D资产创建等细分场景打造垂类应用，服务范围覆盖C、B两端，在人工智能和多模态生成式大模型领域具有显著的技术优势和创新能力。

团队信息与资本支持

生数科技核心团队来自清华大学人工智能研究院，此外还包括来自北京大学和阿里巴巴、腾讯、字节跳动等科技公司的多位技术人才。联合创始人兼CEO唐家渝出身清华大学自然语言处理实验室，曾任瑞莱智慧副总裁、腾讯优图实验室高级产品经理。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。

数据来源：企名片quickin

团队在生成式人工智能和贝叶斯机器学习领域已深耕20余载，在深度生成模型突破的早期就开展了深入研究。作为国内率先布局多模态大模型的团队之一，生数科技具备从深度生成式模型的骨干网络构建、高速采样技术、可控生成方法，到大模型训练等全栈底层技术的原创研发能力。

团队在国际学术界亦享有盛誉，提出的多项成果引领行业风向，核心团队成员更在ICML、NeurIPS、ICLR等国际顶级学术会议上发表了相关论文20余篇，充分展示了团队在该领域的卓越实力与深厚底蕴。

数据来源：企名片quickin

生数科技仅用短短一年时间便成功完成了三轮融资，充分展示了其强大的市场潜力和投资吸引力。2024年3月，生数科技再获新一轮数亿元融资。本轮资金将主要用于推动多模态基础大模型的研发迭代、应用产品创新以及市场拓展，进一步巩固和提升生数科技在相关领域的竞争优势。

数据来源：企名片quickin

产品研发与市场化路径

依托于团队强大创新与科研能力，生数科技于2023年初即开源了全球首个基于Transformer的多模态扩散大模型UniDiffuser，首次实现基于一个底层模型高质量地完成文生图、图文联合生成、图文改写等多种生成任务。该模型在参数量和训练数据规模上，与Stable Diffusion直接对齐。

2023年9月，生数科技发布产业级多模态大模型，全链路自主研发，在图像生成、3D生成、短视频生成等多项任务中达到国际一流水平，同时研发形成视觉创意设计平台PixWeaver、3D资产构建工具VoxCraft两款应用工具。

PixWeaver是一款视觉创意设计平台，支持高质量的文本生图功能，可根据文字描述生成二次元、高清摄影、平面插画、水墨画等多种风格图像。同时具备强通用性、更强的中文理解能力以及更加丰富的画面细节等优势。

VoxCraft支持多元3D资产的高效自动化生成，通过输入文本描述或上传2D图像，即可快速创建3D图像，加速3D建模流程的同时可进一步拓展3D素材库。该产品精度高，贴图分辨率可达到2048*2048，几何拓扑的规整度高，色彩与材质质感真实度高，同时还兼具速度快的优势，在单卡设备上，单个3D模型生成可在数分钟内完成。并且VoxCraft支持Mesh的同步生成，支持高模、低模的定制，可直接对接工业管线，具有很强的实用性。

这两款工具产品，面向艺术设计、游戏制作、影视动画、社交娱乐等创意领域提供赋能，提升创作效率，同时为创作者提供源源不断的灵感和想象力。另一方面，公司也积极地同多家游戏公司、个人终端厂商、互联网平台等B端机构开展合作，开放模型服务，提供AIGC个性化体验、定制化内容生产等方面的能力。

近期，生数科技与全球领先的半导体企业AMD中国达成了战略合作。生数科技的图像生成、3D生成、短视频生成的多模态能力已在AMD多款AI PC、服务器、工作站上部署实现，可协助开发者在端侧高效部署多模态生成式AI应用。

生数科技深知大模型作为新质生产力的重要性，正推动着新一轮科技革命和产业变革。作为领先的大模型团队，生数科技将在多模态方向持续投入，加强底层自研模型的持续攻坚。

相信未来生数科技将在多模态大模型领域取得更多突破，为人工智能产业的发展贡献更多力量，并且通过与多行业展开合作，为更多领域赋能，给社会带来更多的创新和进步。

◁ 上一篇 - 创新引领未来 | 库萨科技入选「2024中国价值企业榜」双榜单

光轮智能｜AI合成数据研发应用 - 下一篇 ▷