节省70%人力！小i华藏通用大模型，如何搞定跨语体政务服务？

2023-11-09 12:22:47 hao333 8965

对于一个特别行政区政府而言，如何在简体中文、繁体中文和英文三种语体之间，通过政务网站，跟有着不同需求的市民之间完成有效的信息与服务交互，提升政务服务体验和效率，降低政务服务成本？这是一个非常现实但又极其头疼的现实问题——小i华藏通用大模型的出现，很好的解决了这个问题。

10月底，小i机器人发布了华藏大模型生态体系，正式启动小i华藏通用大模型的成果落地和商业变现，小i机器人高级总监在发布会上跟媒体共享了一个有意思的大模型商业落地故事：基于小i华藏通用大模型底座，小i机器人与某特别行政区政府完成了一项重要的智慧政务服务共创案例，帮助该特区政府在相关政务即时信息萃取、提供及维护工作方面，节省了70%的人力成本——这是怎么做到的呢？

据悉，在上述华藏大模型商业共创案例中，该特区政府有如下典型性需求：将各种政务信息及其他有用资讯及时、准确地发布到相关的政府部门网站上，然后还需要对这些政务网站及外部网站上的存量信息及数据进行萃取、分类和提炼，向有需要的市民提供各自需要的精准服务支持。

在解决上述需求之前，更有一个棘手问题需要解决：由于该特别行政区市民结构高度国际化，需要在繁体中文、简体中文和英文之间进行无缝自由切换，才能满足不同市民的不同服务需求，但在此之前：没有其他的大模型的能够非常顺畅地解决繁体中文问题——包括ChatGPT在内的大模型，能够较好解决英文和简体中文语境需求，但对于繁体中文效果始终不好。

据文陈成总结，在小i华藏通用大模型介入之前，该特区政府在上述需求上有三大明显痛点：

特区政府对政务网站信息的更新维护不及时，无法实施更新维护，因为网站内容太多了，有政策出炉以后，就要靠人力完成后台更新替换掉，即时性不够高；

完成信息资讯萃取和匹配的人工工作量太大，因为网站上面的内容信息比较复杂，涉及该特区政府下辖的所有部门，如果要靠人工的话，光去找这些内容都要花费很长时间；

市民登陆网站咨询，往往找不到入口，在繁杂的网站资讯中找到所需的精准信息如大海捞针，没有一个入口进来，没有统一的入口让人能找到所有的资讯信息；

语体需要覆盖中文简、繁和英文三种体态的，不仅同样一条资讯在网站上需要进行三次维护，在向市民提供信息服务时，也同样需要满足不同语体需求；

在跨语体能力打通方面，小i华藏通用大模型介入之后，利用小i机器人二十余年来积累的行业一流NLP（自然语言处理）能力和强大的深度学习能力，迅速高效地完成了繁体中文的学习与训练，达到了非常不错的效果。

同时，在资讯的数据萃取、分析、提炼和服务信息智能匹配方面，据文陈成介绍，小i华藏大模型把网站上面所有的资讯信息，通过大模型技术全部抓取过来。获取数据后，再将内容整理成统一的私有库，只要接这个私有库，只要一个入口就能解答用户的所有问题。

“原先市民进各个网站时，需要通过不同的各个入口点进去查询信息，现在不需要了，现在只要一个入口就可以做到，因为我们把所有的资讯信息已经获取到私有库里面了，相当于把它零散的数据做了私有库的归类，这就是私有库的形成。另一方面，我们还通过大模型实时获取特区政府以外的外部资讯信息，帮助他们做政务网站的实时更新，数据的实时更新，就是服务效率，这样极大地提升了他们的政务服务效率。我们当时测算过，原先他们人工来做，现在通过基于华藏大大模型定制的机器人来做，效率提升了70%，也就是节约了70%的人力。”文陈成说。