科技作家陈根:打造类ChatGPT产品需要数据 我国高质量数据在出版社

2023-03-26 15:22:24 来源:上海证券报·中国证券网 作者:孙小程

  上证报中国证券网讯(孙小程 记者 罗茂林)“Open AI至今没有公布它的数据到底来源于哪里,它背后是有强大的高质量数据支撑的。我们国家高质量的数据在哪里?全都在出版社手里。”在近日电子工业出版社主办的《ChatGPT:读懂人工智能新纪元》新书发布会上,该书作者、科技作家、教授级高级工程师陈根博士发表如上观点。

  陈根向上证报记者分析道,目前来看,出版社向人工智能企业开放数据比较困难。不过他看好出版社在ChatGPT领域的发挥,因为每个出版社都有专门方向的知识库。假如在数据安全上授权后建立防火墙,出版社一旦接入相应技术,数据可能一两周就能训练完,专业领域的专家马上就会诞生。

  陈根认为,chatGPT正式开启了人工智能时代,其类人的逻辑与语言能力让人惊讶,并表示:“所有行业都将被重塑,人类社会将被重新定义,这是一个充满着无限商业机会的时代。”

  陈根指出,目前阿里、京东、腾讯、百度等国内企业也在做类似ChatGPT的产品,但也面临着一些挑战。从硬件层面来说,核心的挑战可能是算力。在数据层面,他举例说,微信每天都会产生大量的数据,但是上面的数据大部分都是无效数据,因为只有高质量的数据才能够重复训练。所以对企业来讲,如何获得高质量数据便成为一个核心。

  在陈根看来,现阶段没有必要去讨论“人和人工智能必有一战”这种概念,以ChatGPT为代表的人工智能技术本身是中性的,技术的背后是人类给它传输的数据。与其担心未来人与人工智能是否会发生矛盾,不如现在去反思应该给它导入什么样的数据?赋予它怎样的价值体系?这个反而是更重要的。