打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
ChatGPT 的进击及其对图书馆的影响
userphoto

2023.07.16 江苏

关注


感谢《大学图书情报学刊》

引用本文格式:沈奎林.ChatGPT的进击及其对图书馆的影响[J].大学图书情报学刊,2023(4):10-17.

科技的进步,新技术、新应用如雨后春笋,一些令人惊奇、颠覆认知的新技术,被人们称作颠覆式创新。近十几年,新概念层出不穷,其中有落地实践的,也有随风而逝的,如云计算、虚拟化、物联网、智联网、大数据、微服务、P2P、5G、元宇宙、web3、区块链、NFT等。2023年最火爆的无疑是OpenAI公司推出的ChatGPT,最近已经改名为GPT-4,彰显了公司的未来战略目标:弱化人机对话和智能聊天,向更广阔的领域进发。
1 ChatGPT简述
1.1 ChatGPT概念
ChatGPT是由OpenAI公司开发的大型语言模型。Chat是聊天、对话的意思;GPT是Generative Pre-train Transformer 的缩写,是一种预训练的语言模型,使用Transformer架构处理自然语言处理(NLP)任务。GPT能够生成人类可读的自然语言文本,例如对话、文章或新闻报道。GPT被认为是目前最先进和最具有代表性的自然语言处理模型之一。通过使用大规模的预训练数据和自主学习技术,GPT能够捕捉自然语言中的语法规则、常见的表达方式、常见的上下文和语义含义等。
在用户看来,ChatGPT的形式就是一个对话机器人,准确地说是“续写” 机器人。从技术上讲,GPT不是一个专门为问答和对话设计的系统,而是一个语言模型,用来刻画语言的基本规律。如何建立语言模型呢? 可以只做一件事情:掌握词汇间的组合规律,而掌握这种规律最直接的表现就是让语言学会“续写”,类似于我们人类的“接话茬”。当我们给出前N个词汇时,如果一个模型能够告诉我们第“N+1”个词汇大概率会是什么,我们就认为模型掌握了语言的基本规律。ChatGPT就是这样一个语言模型。虽然ChatGPT看起来能完成各种任务,但它本质上只做这一件事情:续写,告诉你第“N+1”个词是什么。
1.2 ChatGPT关键技术
(1) 大语言模型: Large Language Model,简写为LLM,这是人工智能发展过程中一个里程碑式的模型,它可以解决自主学习的问题,通过海量文本、图片、视频等信息进行学习吸收和输出;(2)算法:ChatGPT采用了从人类反馈中强化学习的方式, Reinforcement Learning from Human Feedback,简称RLHF,人机交互并不断迭代;(3)算力:ChatGPT需要极其强大的计算机支持,主要指CPU和 GPU的消耗,目前看来GPU更重要,也更耗资金和能源;(4) 数据:大数据成就了人工智能,海量的数据是ChatGPT成功的保证之一。
2 人工智能
ChatGPT是人工智能的一种应用。人工智能在20世纪50年代被提出后,经历了很多挫折,也取得了很多成绩,它的发展完美体现了事物波浪式前进、螺旋式上升的规律。
2. 1 人工智能发展阶段
1956 年,为解决人工神经网络“结构复杂” 问题,以麦卡锡、马文明斯基等为代表的从事数学、心理学、计算机科学、信息论和神经学研究的年轻学者齐聚达特茅斯大学,召开了人类历史上第一次人工智能研讨会,并第一次使用了“人工智能” 这一术语,这一年被视为人工智能的元年。这个阶段被称为人工智能发展形成阶段(20世纪40年代至70年代中期)。
1977 年,费根鲍姆的“知识工程”概念引发了以知识工程和认知科学为核心的研究高潮。在此基础上,专家系统和知识工程在全世界得到迅速发展,部分人工智能产品成为商品进入生产生活,这是人工智能快速成长阶段(20世纪70年代中期至90年代中期)。
第三次发展浪潮:人工智能纵深发展阶段(20世纪90年代中期至今)。自20世纪90年代中期开始,机器学习和人工神经网络的研发工作加速推进,人工智能实现了巨大突破。1997年,计算机深蓝完胜国际象棋大师卡斯帕罗夫,重新点燃了人们对人工智能的希望。2004年,日本率先研制出人形机器人Asimo。2006年,深度学习取得重大突破,随后,图形处理器(GPU)、张量处理器 ( TPU)、 现场可编程门阵列(FPGA)异构计算芯片以及云计算等计算机硬件设施不断取得突破性进展,为人工智能提供了足够的计算力,得以支持复杂算法的运行。2005年后,大数据的持续积累给人工智能的发展提供了规模空前的训练数据。2016年,Alpha Go胜世界围棋大师李世石,将人工智能发展的高潮推到了一个新的高度。
2.2 人工智能几个成功的应用
人工智能在如今的应用中,落地商用效果比较好的有以下几个方面:(1)语音识别:利用自然语言处理和机器学习技术,将人的语音转换为文本或命令,例如智能助手和语音控制设备;(2)图像识别:利用计算机视觉和深度学习技术,识别和分类图像中的物体、人物和场景,例如人脸识别、智能监控和自动驾驶汽车;(3)自然语言处理:利用机器学习和语言学技术,分析和理解人类语言的含义和语境,例如机器翻译和智能客服;(4)机器人和自动化:利用人工智能技术,开发智能机器人和自动化系统,可以用于制造业、医疗、农业等领域;(5)推荐系统:利用机器学习和数据挖掘技术,根据用户的兴趣和行为,向用户推荐相关产品和服务,例如电商推荐和音乐推荐;(6)游戏和娱乐:利用人工智能技术,开发智能游戏和娱乐应用,例如智能棋牌游戏和虚拟现实应用。
在人机对话方面,人工智能发展历程很长。1936年,图灵认为可以让计算机理解自然语言,具备人的思维能力。1960年,他设计出著名的“图灵测试” 问题;1966年魏岑鲍姆设计了ELIZA 程序,用来模仿人与机器人的对话;1980年,哲学家塞尔提出了“中文屋子”问题,对图灵测试进行质疑;进入21世纪,IBM的“沃森”赢得了电视问答竞赛,震惊人类;2012年以后,深度学习改变了自然语言的学习方法,人机对话进入新阶段;2022年,OpenAI公司基于LLM模式训练的ChatGPT人机对话应用,引爆了人工智能在人机对话方面的热潮。
3 智能问答
很多研究者在人机交互、智能问答方面做了尝试,并且在一些行业得到了初步应用。比如政府门户网站、电商自助问答、服务型行业、咨询行业、信息服务行业等。
从中国知网搜索“聊天机器人”“智能问答”“人机交互”等,会发现有很多文章在探讨相关的应用与实践,从系统设计、架构设计到各行业应用研究都有涉猎。代表性研究成果有刘超和马东宇、邢超、杨燕、王友奎等人、王蕾、龙新征等人、胡潇戈等人、沈奎林等人的文章。
在政务网站的服务大厅、图书馆在线咨询、电商售前售后咨询等很多领域都能体验在线问答机器人的人机交互。这些体验的表象和 ChatGPT很相似,都是一问一答,区别在于回答是否满足提问者的期待、是否解决了问题,甚至超越了期待。实际上,搜索引擎也是一种问答,也用到了很多人工智能技术。搜索引擎的结果是很多内容的聚合,根据相关度给出文章或者视频列表,至于结果是否满足需要,需要一篇篇甄别。搜索引擎好不好,就在于搜索结果全不全,准不准。
ChatGPT引起人们极大热情和兴趣的原因是它非常接近于自然语言对话,交互式是其一大优点,用户可以与ChatGPT对话,ChatGPT的回答连续、稳定、一致,自然且流畅。
比如和 ChatGPT 聊天,问他一些有关图书馆的问题:
问:什么是智慧图书馆? (来自于公众号“华数图情”)
答:智慧图书馆(Intelligent Library)是一个通过利用现代信息技术、互联网技术、人工智能技术等手段,为用户提供便捷高效的信息检索、资源共享、知识管理和服务支持的数字化图书馆。它不仅仅是传统图书馆的延伸,还是一个集学习、研究、沟通、创新等多种功能于一体的综合性知识中心。智慧图书馆的主要特点包括:(1) 数字化资源:智慧图书馆拥有大量的数字化资源,包括电子书、电子期刊、多媒体资料等,可随时随地进行访问和使用。(2) 信息检索:智慧图书馆采用先进的信息检索技术,帮助用户快速准确地找到所需信息。(3)资源共享:通过互联网技术,智慧图书馆能够实现资源共享,方便用户获取其他图书馆的资料。(4) 个性化服务:智慧图书馆利用大数据和人工智能技术,为用户提供个性化的推荐服务,帮助用户找到感兴趣的资源。(5)知识管理:智慧图书馆具有强大的知识管理功能,可帮助用户整理、管理和共享知识,提高工作效率。(6)服务支持:智慧图书馆通过线上线下相结合的方式,提供各类服务支持,如咨询服务、培训服务、学术活动等。(7)社交互动:智慧图书馆为用户提供社交互动平台,方便用户与其他用户交流、分享和合作。智慧图书馆不仅改变了人们获取信息和知识的方式,还极大地提高了图书馆的服务水平和用户体验。
问:你认为什么才是智慧图书馆? (来自于公众号“圕聚”)
答:智慧图书馆是一个能够为其社区提供广泛信息和资源(包括传统的纸质材料和数字资源)的图书馆。智慧图书馆的目标是通过提供必要的工具、资源和服务,来帮助其用户实现学习、研究和个人兴趣的目的。智慧图书馆运用技术和创新解决方案来提高用户体验,并与其社区积极合作,开发针对其变化的需求和兴趣的计划和服务。此外,智慧图书馆重视和支持识字、教育和终身学习,并努力为其社区的所有成员创造一个包容和友好的环境。
问:世界读书日快要到了,你能帮我写一篇阅读推广的文案吗? (来自于公众号“圕聚”)
答:当然, 很高兴为您写一篇阅读推广的文案。
阅读是一种珍贵的体验,它为我们带来了无限的知识和想象力。阅读不仅是一种享受,而且是一种促进思维和情感发展的有效方法。随着世界读书日的到来,我们有机会更深入地了解阅读的重要性,并将其作为一种日常生活的习惯。
今天,我们可以轻松获得任何类型的信息,但是,阅读可以帮助我们更好地理解和分析这些信息。阅读可以拓展我们的视野,提高我们的文化素养,帮助我们了解不同的文化和历史。
不管是小说、散文、诗歌、非小说类图书等,阅读都可以帮助我们获得心灵上的满足和愉悦。它可以让我们逃离现实,沉浸在不同的世界中,感受不同的情感和体验。
那么,让我们一起庆祝世界读书日,通过阅读来提高我们的知识和情感,获得心灵上的满足和放松。让我们在图书馆或书店寻找一本心仪的书籍,开启一段美好的阅读之旅。
4 ChatGPT在各行业的应用和表现
从上一节的问答来看,ChatGPT的回答令人满意,很多人测试过各个行业的问答,比如新闻界、医学界、图情界,有很多教师、学生利用 ChatGPT组织论文框架,甚至写出一篇非常不错的论文。
ChatGPT的红火引起了讨论狂潮。在人们的惊叹声中,强人工智能的发展被推到风口浪尖,人们似乎看到了人工智能超越人类的一天。人工智能从业者看到了新的蓝海,找到了新的突破点;各个互联网、人工智能相关公司开始跟进投资,投入研发,想在这波浪潮中找到一席之地;一些学术机构出台了各种规定,严格拒绝学术研究从业者利用ChatGPT代替人工思考和写作;知识产权和版权从业者看到了巨大的版权危机,进而研究相关的法律法规;新闻编辑和记者感受到更大的压力,之前有一波人工智能热潮,机器人编辑已经能胜任一些新闻报道的撰写,特别是在体育新闻领域;更多的从事咨询行业的人员感到深深的危机,比如图书馆咨询部门的人员,他们的知识储备已经被ChatGPT颠覆了;ChatGPT写程序代码也有板有眼,它会不会为自己写一段代码改变自己?
ChatGPT3.5发展到GPT-4,功能更强大。人工智能某些工具已经可以作画,也可以生成视频,你写脚本我做视频、以文生图已经来到我们身边。GPT-4开始进行大规模图形训练,相信不久会令我们大开眼界。约翰霍普金斯大学的专家研究表明,GPT-4的心智理论已经超越了人类
罗列一下 ChatGPT 能做的事情,包括但不限于以下部分:
提供主题后创建学习笔记;为任何类型的面试提出问题;使用聊天机器人与人类聊天;从给定的配料列表中创建任何种类的食谱;为研究主题文章创建一个整体结构;创造与VR游戏和健身相关的创意;将会议记录写入摘要;编写python docstring;将任何文本转换为色彩;成为一个聊天的朋友来打发无聊; 将JavaScript表达式转换为Python;创建简单的SQL查询;回答与语言模型相关的问题;为给定数据创建电子表格;查找并修复代码中的错误;创建产品名称;通过产品描述创建广告副本;事实数据的答案;用简单语言解释代码;翻译编程语言;将电影标题转换为表情符号;口语翻译;任何语言的正确语法;根据现有知识回答问题。
在GPT-4应用里,已经用到了插件功能,就是把第三方好的AI应用嵌入GPT-4,GPT-4可以做更多的事情,有人戏称为它有可能成为下一代操作系统。
总之,ChatGPT颠覆了人们的认知:原来大数据可以这样用,人工智能可以走这样一条不同以往的道路;对话式AI居然发展到了这个阶段,真的是未来不是预测的,预测未来的方式就是创造未来;ChatGPT颠覆的不是软件公司,而是服务行业。
ChatGPT最亮眼的地方在于它的世界模型和生成能力。在世界模型方面,我们可以借助ChatGPT的常识推理器实现更加智能的知识推导和应用,帮助我们更好地发掘ChatGPT在专业领域的应用潜力;在生成能力方面,ChatGPT可以通过巧妙的方式解决个性化模板的困难,从而实现更加智能、个性化的应答能力,帮助我们更好地应对不同场景和需求的挑战。人类在掌握一些知识后, 学习的就是这些 “套路”。ChatGPT具备“套路”生成能力,它生成的东西不仅可以解决你的问题,甚至还能指导你完成尚未实现的任务。它具有多轮对话能力, 可以通过“in contextlearning”学习。在工作中,从员工的角度看,你需要学会如何与ChatGPT建立联系,以便更快、更准确地获取信息。
5 ChatGPT的不足
在使用ChatGPT的时候,我们也会发现一些答非所问的情况。这是因为ChatGPT实际上只是一个大规模的语言模型,只能在大规模数据的基础上对人类的语言行为进行模仿,并没有真正理解聊天的内容。实际上,ChatGPT尽管能够针对人类的输入产生类似于人类的反应,然而,它并不知道它知道什么,也不知道它不知道什么, 并不能真正地理解自然语言。ChatGPT和搜索引擎有联系,更有区别,不能像搜索引擎那样提供实时信息。所以我们经常发现它会提供不符合事实的错误答案,或者一本正经地胡说八道,或者说一些永远正确的废话。由于这个原因,不少人唱衰 ChatGPT以及AIGC (人工智能生成内容) 的应用。
在涉及数学等自然学科时,ChatGPT 表现还很不足。这主要是因为ChatGPT是基于巨量语料库进行训练出来的,这后面的算力、算法要经过不断的改进与学习,在前期还需要大量的人工标注,比如在词组产生二义甚至多义的情况,在涉及种族歧视或者其他不当言论的时候,都需要人工干预。在语料库足够大的情况下, 前期人工标注后, ChatGPT才能表现得更好。
ChatGPT胡编乱造最主要的原因是GPT在巨量语料的预训练中完全是以旁观者的身份存在,缺少一个“自我”。语料中的内容是客观存在的,并不因GPT知不知道这些内容有任何的变化。GPT只是在模仿这些内容的生成。假设GPT语料中有一些案件分析文本。这些文本首先会交代一个案情,然后法官会分析解剖这个案件,给出这些案件的法律适用(法条),最后法官还会给出几个以往的类似案例作为参照。使用ChatGPT做案件分析时,它其实是在模仿语料中的这个过程,但如果大模型的法律法规训练得不够充分,ChatGPT找不到合适法条的时候,它知道这个位置需要生成一个法条,它就会运用它的泛化能力编造一个最像的法条。ChatGPT不会回答“我找不到合适的法条”,因为它学习模仿的语料文本中不会发生这样的事情。
造成ChatGPT胡编乱造的第二个原因是训练不充分。从某种角度来说,胡编乱造不是大模型的一种错误,而是对相关知识缺乏充分训练的一种中间状态。假设人类世界的知识是有限的,大模型装下了所有的知识,并对之进行了充分训练,那么绝大多数胡编乱造的情况会消失。因为大模型可以清楚地知道知识的界限在哪里,哪些是存在的,哪些是不存在的。但实际上,人类世界的知识可以说是无限的,大模型虽然知道很多知识,但它并不知道边界在哪里。训练语料中存在着大量的边缘知识,出现的次数比较少,大模型没有机会进行充分的训练,以至于不能很好地理解、掌握这部分知识。如果在对话中涉及这部分边缘知识,ChatGPT就会出现胡编乱造的现象。
比如在问一些关于中国影视演员资料的时候,ChatGPT明显比百度的“文心一言”弱,这是因为语料训练不够,ChatGPT明显缺乏中文语料库的训练,这也是它在中文语境下表现不好的原因之一。
如何解决ChatGPT胡编乱造的问题?一是通过与外界交互式的训练,让ChatGPT拥有“自我”,可以根据“自我”的状态调整对话内容。这样,当ChatGPT不拥有准确地回答某些问题的知识时,它就会回答“我不知道”。实际上,OpenAI也正走在这条路上。基于人类反馈的强化学习(RLHF)给了ChatGPT和外界交互的机会,它不再仅仅是一个世界的旁观者。当ChatGPT胡编乱造的时候,我们可以对它进行纠正,告诉它正确的回答是“我不知道”。当这种反馈训练达到足够量级的时候,ChatGPT就可以将这种胡编乱造的场景和自身的知识掌握状态联系在一起,进行泛化。二是让大模型尽可能多地吸收语料知识,并对之进行充分训练。多吸收各方面的语料知识就是扩大大模型知识的范围,使得用户提出的问题基本上可以落在大模型边缘知识以内的部分,即大模型可以充分理解的知识范畴中,充分训练就是让大模型可以完全掌握并记忆住这些知识。
这两个方法看起来简单;实现起来并不容易;一是因为语料库的海量存储问题;二是因为算力问题;存储和算力的成本非常巨大;这也是制约ChatGPT快速发展的瓶颈,国内相关研究跟不上,产品表现很一般,最大的原因就出在存储和算力上;算法和模型的差距排在其次。
6 ChatGPT引发的跟风潮流
ChatGPT爆红之后,有不少资本投资商、软件开发商和应用提供商趁热而入。其中有如下几个原因:资本逐利的本性,都想从这波风口中赚到不错的收益,不少公司想复刻这个成功的模式,从这波红利中分得一杯羹;技术潮流紧跟者,生怕被时代抛弃;要紧紧跟着,追逐热点;在不具备访问ChatGPT的国家和地区,建立类似的技术应用,填补此地的空白领域,占地为王;竞争对手的恐慌和反击。
最出名的是谷歌。谷歌缔造了搜索引擎的霸主帝国,在人工智能方面被OpenAI反超,必定是要反击的。谷歌的聊天机器人叫Google Bard,谷歌号称研发这个工具已经10年,但是发展的路子还是以前的AI开发模式,ChatGPT发布后, 谷歌急了,勉力放出Google Bard,但效果差强人意,实在不能堪当大任。
国内的百度发布了类似的产品“文心一言”。基于百度新一代大语言模型的生成式AI产品“文心一言”正式面世,官方展示了“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。“文心一言” 某种程度上具有对人类意图的理解能力。李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大。
华为申请注册NETGPT商标。据称,华为旗下盘古系列AI大模型即将上线,分别为NLP+大模型、CV+大模型、学计算大模型(气象大模型),其中NLP大模型被认为最接近人类中文理解能力的AI大模型,而CV大模型首次兼顾了图像判别与生成能力。
医联推出国内首款AI医生medGPT,于2023年4月进行测试,预计5月正式发布。据悉,医联medGPT采用大模型技术,基于医疗知识图谱为模型提供丰富、准确、结构化的医疗知识,收集整理接近20亿条真实医患沟通对话、检验检测和病例信息进行深度训练学习,同时利用医生真实反馈进行强化学习,用以保障模型的推理质量、准确性与可靠性。
国内教培巨头学而思将推出AI数学大模型MathGPT,预计年内上线相关产品。MathGPT的研发,其面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心打造而成。目前,该AI数学大模型已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。学而思学习机近期将上线一款“AI助手”,涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该AI产品于5月11日开启内测。
最大开源社区Hugging Face发布了HuggingChat,有300亿参数,此大模型免费用。
OpenAssistant是一个开源的对话模型,基于Pythia和LLaMA微调而来,主要用于训练人类标注的数据。它的目标是对标ChatGPT。
国内首个类ChatGPT模型:复旦大学MOSS日前正式开源。据介绍,MOSS是一个支持中英双语和多种插件的开源对话语言模型,moss-moon系列模型具有160亿参数,在FP16精度下可在单张A100/A800或两张3090显卡运行,在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力,以及使用多种插件的能力。
阿里巴巴4月份正式宣布推出大语言模型“通义千问”。“通义千问”是一个超大规模的语言模型,具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。
字节跳动旗下今日火山引擎在其举办的“原动力大会”上发布自研 DPU等系列云产品,并推出新版机器学习平台:支持万卡级大模型训练、微秒级延迟网络,弹性计算可节省70%算力成本。火山引擎称,基于自研DPU的GPU实例,相比上一代集群性能最高提升三倍以上。火山引擎总裁谭待透露,“国内大模型领域的数十家企业,超过七成已经在火山引擎云上”。
大模型处在风口浪尖上,还有很多公司在跟风做,但实际效果并不怎么好,没有一家能叫得响,都达不到ChatGPT的应用水平,这其中的原因非常多。技术力量、巨大算力、巨大存储、经济政策、法律体系等等都制约了这些技术和应用的发展,某种程度上可以说,他们还没摸到门道。
7 ChatGPT面临的挑战
7.1 技术挑战
(1)不稳定和不可解释性。这是整个深度学习模型所具有的,“涌现效应”导致这一问题更加严重。特别在一些敏感领域,这一问题更加凸显。例如在自动驾驶领域,机器的事故率已经低于人类司机,但为何大家还不愿意完全相信自动驾驶呢? 因为自动驾驶虽然事故率低,但是它的事故是不可解释的。
(2)知识更新。让 ChatGPT 临时接受新的知识比较困难。很多知识在不同的领域是不一样的。我们经常会遇到在特定场景需要特定知识的情况,对于ChatGPT 而言,它很难做到。
(3)事实性错误。事实性错误是指信息不符合客观事实,而ChatGPT无法直接了解客观事实,它只能了解语言。
(4)输出的同质性。ChatGPT所做出的回答往往是人类的主流观点。因为它是一个概率模型,它会以大概率的答案去回答它的任务。它的这种特点实际上有可能加剧信息茧房现象。
7.2 科学问题
(1)语言不再是人类的专属。ChatGPT可以生成语言。那么这个意味着什么呢? 基本上可以预见,在未来的几年中,互联网上大部分信息将不再是人类撰写的。事实上,现在Twitter中30%以上的活跃用户都是机器人,微博上也有大量的水军机器人。
(2)ChatGPT是否能够创造新的知识,还是只将训练语料中的知识换一种更精炼和高质量的方式进行表达? 如果是后者的话,那么人类对于ChatGPT的使用会造成知识的收敛,降低人类知识的创造效率。如果 ChatGPT能够创造新知识,那它则会大大加速人类获得新知识的效率。
7.3 伦理问题
(1)用户隐私问题。我们输入的问题,技术上是可以被ChatGPT的所有者所获取。
(2)反向影响问题。ChatGPT会通过它所输出的内容,反过来影响人类文化,就是我们所说的人性异化,人性向机器靠拢,机器向人性靠拢。
(3)不当使用。比如说学生用ChatGPT作弊。
(4)人机共生与加速极化。大模型和人类有一个典型的共生循环,什么意思呢? 模型是依赖于人类产生的数据来训练的,ChatGPT用人类说的话做训练之后,他再给人类答案,并影响人类认知。人类认知被影响之后,又会说新的话。“你有权保持沉默,但你说的每一句话都会成为训练语料”,新的话又变成ChatGPT新的训练语料。如此反复,就形成一个共生循环,并进一步导致人工智能模型越来越像人,而人越来越像人工智能模型,向人机共生文化逼近。
(5)生产力垄断以及社会和国际关系重建。这一点恰好与区块链形成对比。区块链是分布式,能够去中心化,打破垄断。而ChatGPT这种大模型需要大规模的数据和算力,只有极少数的人或者机构能够提供这样的服务。由于ChatGPT很大程度上来自涌现,没有太多新技术。很多大的互联网公司都想形成 ChatGPT等技术的垄断,从而获得权力,并影响社会、国际关系。回顾互联网发展历史,互联网发明者Tim Berners-Lee做的最伟大的一件事就是放弃了互联网专利。
(6) 人工智能的社会角色与伦理地位。随着ChatGPT越来越具有类人的特征,用户不可避免地有将其人格化的冲动。那么他是否会具有类人的地位?这个可能是需要考虑的问题。
7.4 冷静与反思
2023年3月份,网上曝出一封千名专家的联名信,呼吁立即停止训练比GPT-4更强大的AI系统,暂停期至少6个月。目前签名的有图灵奖得主Yoshua Bengio、Stability AI首席执行官Emad Mostaque、苹果联合创始人Steve Wozniak、纽约大学教授马库斯、马斯克,以及《人类简史》作者Yuval Noah Harari等。公开信表示,大量研究表明,得到顶级AI实验室的认可、具有人类竞争智能的AI系统,可能对社会和人类构成深远的风险。
正如广泛认可的Asilomar AI原则中所述,高级AI可能意味着地球生命史的深刻变化,我们应该投入相应的考量和资源,对之进行规划和管理。不幸的是,到现在为止,还没有任何人采取行动。最近几个月,全球AI实验室已经完全失控,它们疯狂地开展AI竞赛,开发和部署更强大的AI,而没有任何人可以理解、预测、控制这些 AI,连它们的创造者都不能。在这6个月内,所有AI实验室和独立学者都应该合力开发一套共享安全协议,用于高级AI的设计和开发。协议完成后,应该由独立的外部专家进行严格的审计和监督。协议必须确保这些AI系统毋庸置疑的安全。这并不是说,我们要绝对暂停AI的开发,只是说,我们应该从危险的竞赛中退后一步,转向具有涌现能力、更大、不可预测的黑箱模型。
8 ChatGPT对图书馆行业的影响
ChatGPT对各个行业形成了冲击,笔者以图书馆工作为例,试图阐述它在哪些方面可以帮助图书馆更好地完成工作,或者换个说法:ChatGPT可以取代哪些图书馆现有的工作。

首当其冲的是咨询岗位工作。图书馆工作之一就是为读者提供信息咨询服务,除了那些需要深度分析的学科问题,对于一般知识性、认知性问题,ChatGPT可以做得非常好。在GPT-4出现后,基于AI的知识图谱功能,在一些深层次服务方面,GPT表现也非常抢眼,况且GPT-5已经呼之欲出,在咨询、专题等服务上,GTP极有可能替代图书馆咨询岗位。至少目前来看,ChatGPT已经成为咨询业的左膀右臂。

图书馆给读者提供信息查询服务,查询的主要是纸本书目信息、电子图书、各种电子数据库中的论文,以及视频、图片等信息。读者使用查询途径一般是通过OPAC检索、统一检索平台或者单独进入某一个系统去检索。就目前ChatGPT的能力来说,它能够做到更好的信息融合。比如问一本书的情况,它极有可能提供的不仅仅是图书的基本信息,如题名、作者、出版社、馆藏地点等信息,还能提供图书的简介、评价、评分、销售状况、作者信息的拓展、相关图书推荐、学术领域动态、学术信息推荐,等等。

图书馆为读者提供查收查引、科技查新等信息服务。经过大数据训练的 ChatGPT,能为这项工作起到非常有效的帮助,在检索和信息聚合方面,ChatGPT表现确实比较亮眼。当然,这项工作要做得好,还需要ChatGPT在国内落地应用,并且有很多人前期给它“喂”过一定量的数据,进行纠错、反馈、标引等工作。

图书的编目分类组织工作一直以来是图书馆的核心业务之一,是图书馆专业的体现、安身立命之本。图书馆从手工管理年代进入电脑网络管理、数字化时代,到如今的智慧图书馆阶段,经历了很多工作方式和应用的转型。越来越多的新技术进入图书馆,如大数据、物联网、人工智能等。下一代图书馆管理系统已经融入很多人工智能技术,比如在编目模块,已经有厂商和图书馆人员联合研制自动编目系统。研究ChatGPT、GPT-4,以及爆出来的GPT-5特性,在图书编目、信息分类、信息组织方面,GPT一定会大有所为,人工智能编目不是遥远的梦。

阅读推广、图书推荐、活动策划也是图书馆的工作内容之一。ChatGPT已经能胜任上述工作,甚至不用GPT-4,更不用说GPT-5了,效果远超人工写的文案。在网络上,通过搜索引擎我们可以查到大量书评、各种活动总结、活动文案、图书推荐语等,豆瓣、知乎、百度文库和稻壳网等平台就可以满足我们的需求,而把大量数据进行吸收、融合、训练,继而产出非常好的输出效果就是ChatGPT的强项了。

除了对实体图书资料的传送需要借助人工,文献传递等通过网络处理的工作,人工智能完全可以胜任。在电子文献传递方面,目前很多传统的IT系统就可以做到,利用ChatGPT能让这项工作更加出彩,效果就类似于你在微信群或者QQ群向别人索取电子文献一样。

图书馆各种活动都会有展板、易拉宝展示等需求。根据国外网友利用GPT-4加插件生成的各种图像看,GPT-4已经达到了以假乱真的效果。据IT之家图文报道,一个国外网友提问 GPT-4:请给我提供一桌荤素兼备、营养丰富的美食图,生成的图像令人满意。国外一位宝藏网友发布了一篇神帖,她花了整整一周的时间,利用ChatGPT生成了许多「数字/艺术」相关主题的提示,然后生成了超过1.2K 的Midjourney美图。这篇文章题名是《免费,终极ChatGPT提示+Midjourney宝藏神图,1200+图片和咒语,震撼人心》,感兴趣的人可以去看看。

图书馆还有很多其他服务,或多或少都可以借助ChatGPT完成得更好,甚至可能被它直接替代。

9 结语

ChatGPT还在迅猛发展,各种消息层出不穷。我们看到了人工智能的飞速发展,也看到了一些人的质疑,以及质疑后面资本的力量。但无论如何,ChatGPT的成功,归根结底是人类智慧的胜利。

ChatGPT的出现,使得人工智能由感知智能进入认知智能,改变了此前简单的人机关系,开创人机合作的新时代。虽然ChatGPT具有优异的对话性能,但我们仍要清醒地认识到,人类对于自然语言的理解,除了依靠语言内部各种关系的知识,还需要依靠外部物理世界、外部精神世界和外部社会历史世界等背景知识。纵观从图灵测试到ChatGPT人工智能中人机对话系统的历程,其背后数据资源、技术迭代和科学范式都发生了巨大的变化。人工智能借由人机对话深度介入语言生活。面对 ChatGPT 的进击,我们应该积极面对,主动拥抱。几十年来信息革命的历程证明了技术的突破对人类生活和科学研究的巨大推动力,不管是增量型进步还是颠覆性创新,不管是坦途还是曲径,事物的发展总是波浪式前进、螺旋式上升的。对于我们相关的从业者来说,研究自己行业的特性,把它和新出现的技术有效结合起来,可以帮助我们更好地发展。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
ChatGPT,人类认知力延伸的竞赛
对ChatGPT的二十点看法
ChatGTP全景图 | 背景 技术篇
人工智能的80年进化编年史:从想象到现实
GPT-4和ChatGPT大比拼,究竟谁胜?
对话前OpenAI科学家:爱、灭亡和人工智能
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服