强人工智能时代媒体的实践与思考

时间:2024-09-19 阅读:3 评论:0 作者:admin

[摘要]人工智能技术正在成为重要的生产力工具,重塑业务流程、改变工作场景,高度精准地影响着媒体行业的发展。从PGC、UGC、PUGC到AIGC,生产模式不断变化;从ChatGPT(文本生成)到sora(视频生成),以及跨模态和多模态生成,大规模预训练模型不断演进。媒体积极应用人工智能技术不断探索实践,以形成突破性创新,实现“从能用到可用,再到好用”的优势升级。

【关键词】生成式人工智能、大模型、机器写作、数字智能、智能媒体云

近年来,人工智能生成云持续受到热捧,它结合人工智能自主意识、推理等特性,形成问题的最佳解决方案,是弱人工智能向强人工智能转变的重要节点。人工智能领域发布了规范性政策——《生成性人工智能服务管理暂行办法》,在发展与保障并重、促进创新与依法治理相结合的原则下,采取有效措施鼓励多领域生成性人工智能服务的探索。本文以南方智慧媒体云建设为依托,从实际工作出发,总结人工智能技术在媒体领域的场景化产品应用,并提出几点思考。

1.人工智能加速媒体智能化转型

1. 推动新的内容生产模式

当前,内容生产方式正经历着从PGC(专业内容生产)、UGC(用户生成内容)、PUGC(专业媒体与用户共同生产内容)到AIGC(人工智能生成内容)的转变。该模式构建了从数据、创意到创作的生产通道,将实施过程变成可重复、可持续的算法劳动,支撑全天候内容生产,同时实现规模化生产效率的跨越式提升;且由于丰富的写作素材来源、个性化的创作视角、沉浸式的技术手段提升了新闻作品的表现力。AIGC创作赋能增强内容供给,助力实现内容产业高效的环节互动和市场配置,形成更加开放的商业闭环。

2. 升级智能沟通方式

人工智能技术的深度应用引发了人机关系的迭代,“人”与“机器”都被置于主体地位,二者之间的紧密协同互动提升了“主体、内容、渠道、受众、反馈”等媒介和传播要素的耦合度。一方面基于数据处理与算法策略,助力提升新媒体信息分发流通效率;另一方面可根据用户获取信息的习惯与偏好,即时推送信息,贴合用户体验,提升传播效率,增强“技术感”;其次,建立信息传播热度、趋势以及用户认知、态度、行为层面的反馈模型,并基于反馈结果形成自调节机制,达到有效传播状态。

3. 更新媒体行业生态结构

人工智能正在重新定义媒体,由点到面、由局部到整体,为传媒行业带来新的活力。对于存量业务而言,人工智能的主要价值在于降本增效;而对于增量业务而言,伴随着人工智能的逐渐成熟和传媒行业的规范化,将不断拓展行业形态和边界。比如通过提升内容创作生产力和数字感官体验,直接推动数字广告、数字馆藏、数字展厅、数字版权等数字信息产业的消费升级。智能化还支撑传媒的人、财、物等关键资源要素的数字化感知、科学配置和风控监管,通过运营管理价值评估,优化媒体生产关系,提升整体竞争力。

二、人工智能赋能媒体的一些应用实践

1. AI智能问答:“模型即服务”在媒体领域的场景化运用

“模型即服务(MaaS)”是指以模型为核心提供产品、技术和服务,这一概念在ChatGPT热潮后的“百模大战”中被频繁提及。大模型的构建包括大数据、媒体应用,关键在于利用MaaS推动大型AI模型的场景化落地和极简应用,这是一个复杂的系统工程,涉及大算力、强算法等全栈技术。

在相关法律法规的指导下,南方传媒集团内部发布了《生成性人工智能服务管理及使用规范》。南方智能传媒云随后针对采编使用场景推出了“智能创作助手”,在此基础上针对媒体应用场景进行二次开发和优化,满足适配需求。“智能创作助手”在本地部署并提供服务,构建以对话、答题为核心的人机交互接口中枢,这一中枢还具备智能代理功能,已接入GPT4、文心易言、科大讯飞Spark、腾讯混元等通用大模型。当用户用自然语言发出对话指令时,接口中枢调用不同的AI模型协同生成答案。在技术端,“创作助手”通过用户与AI模型的对话,以及业务数据的反馈和优化进行学习和发展,基于预训练的具有泛化能力的模型库不断总结媒体业务特征和规律。以相对较低的门槛形成“端到端”的模式,最终为媒体从业者提供更强大的信息整合分析和提炼汇总能力,以及更精准的问答搜索服务,提高信息获取效率。

(二)AI机器写作:“小胜大”小模型恰好适合专业领域

城市生活服务app代理_城市代理人是做什么的_城市代理怎么做

相比于拥有数千亿参数的大型模型,小模型的计算复杂度要低得多,往往只需要更少的计算和存储就能完成专业任务,同时还拥有更快的推理速度。构建小模型的意义在于,通过输入更精细的数据集,可以提高模型的可理解性和可解释性,从而控制输出模型的精度和质量,最大化功能价值。

2023年3月,南方日报“万财AI快车”2.0版首次发布。此前的“万财AI快车”1.0版是南方日报2019年推出的“小南”写作机器人,其利用财经新闻写作模板,将提取的关键信息转化为程序化、结构化的叙述性文本,已生成十余万篇文本稿件、发布数千篇稿件。不同于1.0版,“万财AI快车”2.0版的特点是:一是数据来源更加广泛,加大对银保监会、证监会、上交所、深交所、司法文书等渠道数据的采集,接入金融行业动态数据;二是突破单一新闻视角,聚焦上市公司高管变动、财报速递,三是依托南方媒体云,训练了超30亿条金融领域股票数据,搭建了30个垂直数据库,定义并优化了110个数据模型,增强了小模型的建模推理能力。

一方面,“万才AI快报”2.0版替代了劳动力密集的信息收集工作,能够围绕设定的话题形成连续的量产规模效应;另一方面突破了机器写作常用的模板创作方式,探索以人为本的“由浅入深、由精至虚”的机对接模式、产品形态与逻辑,通过信息点的关联组合,生成更有深度、更立体、更全面的稿件。为了配合机器写作,编辑还同步定制了单稿生成速度最快在3分钟以内,“三审三校”后即可快速发布。更具开创性的是,它加入了“写作框架、叙述语气、语言打磨”等随机因素,使生成的稿件更加多样化,其创作出的新闻稿件更加贴近人类自然语言语法,并逐渐呈现出情感化特征,改进后的“万财AI快报”2.0版本平均阅读量提升36%,单篇文章最高阅读量达190万。

(三)AI媒体融合制作——在产品呈现层面充分释放AI创造力与巧思

AI技术能够“低成本、高效率”地在生产端实现文字、图片、视频等不同形式和风格的转换,并在用户端提供更具科技先进性和沉浸感的产品交互体验。

南方传媒云将主流AI绘画平台如Stable Diffusion、Midjourney的通用风格模型本地化,用自有图片加上想要效果的图片作为增量样本进行模型再训练和微调。绘画平台具有高度的通用性和开放随机性,同时又保留了自身独有的元素。在这个平台中,通过输入和定义正反面提示词,可以从零开始生成初始插画或真实场景,并不断调整描述词,以完善图像创作需求的多重贴合,并辅助绘画上色、细节优化、风格转换等产品设计工作。例如在南都APP发布的《最美松山湖人》、《广州城市生活地图》等创意产品中,应用AI绘画文转图、图转图功能,快速实现图像风格转换。2024年,N视频发布《AI视频看网红城市》,混合使用工具,实现视频风格转换,降低制作成本。

南方媒体云目前提供AI人脸融合等模块化技术能力,结合内容创意玩法优化人脸融合规则,实现头像、照片、特定图的人脸融合,支持单应用、多模板、用户切换背景、自定义贴纸,一键生成卡片分享。例如,AI人脸融合在南方+发布的《+游广东,带上自己的城市PLOG》等产品中已经成熟应用,为用户营造沉浸感,流量超过200万。

(四)AI内容审校:基于大型语言模型提升全栈校对能力

面对新媒体平台日益增长的产出和发布量,人工智能可以辅助进行细致准确的审稿和校对工作,支持文本、音频、视频等多模态审阅,涵盖稿件、广告、H5作品,以及用户头像、昵称、评论等全场景可使用,其校对速度和准确率均优于传统方式。

AI内容审核在媒体建设中的优势有:一是拥有优质私有域数据集进行预训练,例如南方媒体云的AI内容审核充分利用了南方报业集团收集、整理、筛选和标注的7亿余年中文新闻语料;二是基于业务场景和语言环境的知识积累和规则积累,特别是专业词汇的持续建立和更新;三是基于人工反馈的强化学习模型的建立,让媒体编辑能够根据审核结果做出是否采纳、如何采纳的专业判断,并通过人工反馈推动模型强化学习和迭代升级。 2023年,在通用大语言模型的支持下,南方智媒云AI内容审校推出的“智媒云盾”可在巩固政治内容校对优势的基础上,实现对中文文本错误如文本性、知识性错误,以及基于语义关系理解与推理的错误等校对升级。在中文文本纠错(CSC)任务对比SIGHAN数据集上的测试结果,“智媒云盾”的查错纠错能力F1值明显优于主流商业软件。目前,“智媒云盾”已全面应用于南方日报、南方+、南都APP、N视频等的整个采编流程,每年自动校对超过51亿字、67万张图片、58万余个视频,校对率达到96%。

(五)AI热点发现:新闻场景下事件地图传播脉络分析

知识图谱是通过实体和关系的交互表达,对人类知识进行显性化表示,使机器能够像人一样理解客观世界。从知识图谱到事件图谱,通过事件信息与事件关系的交互,对事物间的关系进行客观、精准的表达,非常适合在新闻场景中使用。

南方智能媒体云利用大模型技术实现事件抽取、信息补全、关系推理和事件预测,构建的事件图谱已用于热点事件检测、事件脉络分析和未来事件预测,例如AI热点发现每小时生成滚动数据,100个热点事件,实时识别和跟踪指定事件、突发新闻、重大情报,同时快速提取事件关键信息,深挖事件脉络,辅助编辑了解事件发展态势和舆情走向。在南方+客户端分析用户评论,帮助内容创作者和运营者更好地了解用户关注点,发现高价值、高影响力话题,更好地挖掘内容报道角度,丰富互动形式,激活“正能量”。

(六)AI虚拟主播——“高精度、可交互、超逼真”小样本数字人应用

AI大模型正在推动人机交互模式的革命,让新一代数字人更加真实、实现成本更低、互动性更强,比数字人更加进化。

2022年11月,南都N视频在行业内率先推出虚拟主播“小N”,实现24小时不间断新闻视频输出。作为真实主播的“数字化身”,大幅提升新闻生产效率。基于更少的训练样本,可以实时优化细节,渲染“小N”人像特征、光影等造型。同时基于智能人像驱动,可以绑定真实对话场景中的唇形关系。此外,南都还推出了另一位3D动画主播“凌美香”,在《寻宝记——寻找湾区民间文化力量》的融合媒体策划中,利用数字人应用快速生成更逼真的数字形象,并赋予其特定的任务身份设定。

城市生活服务app代理_城市代理怎么做_城市代理人是做什么的

对于数智化应用,南方智能媒体云定制开发了富文本编辑器,创作者可通过组件裁剪、拼接、插入等逻辑实现虚拟主播的图片选择、屏幕配置、样式交互、数据绑定等。在语音识别与合成方面进行了优化,支持多音字正音、异步任务排队、分段试听等方式,实现长文本的试听与合成。南都N视频将富文本编辑器融入制作发布流程,2024全国人大大会期间,N视频借助创作平台虚拟主播工具的支持,快速制作并发布了H5产品《穿越时空!AI讲述广东的过去与未来》;也可向视频平台创作者开放使用,助力视频账号快速定制广告,实现商业变现。

3.媒体AI赋能的机遇与挑战

1.人工智能的进化给媒体带来更多想象空间

2024年2月16日,OpenAI宣布推出全新生成式人工智能模型Sora。通过文字指令,Sora可以输出长达60秒的视频,包括高度精细的背景、复杂的多角度镜头,以及多种情绪……Sora的出现和视频生成效果引发热议,代表着人工智能进化到更高阶段。从最初的“AI识别”,机器像人一样识别事物,比如图像识别、语音识别、视频识别;从“AI理解”到“AI理解”,通过学习人类的知识、模仿人类的语言,比如通过GPT的广泛应用,可以更友好地判断语义逻辑,实现更准确的多模态理解;再到如今的“AI意识”,可以逐渐发现和学会理解人类与世界互动过程中隐藏的知识和物理规律。比如Sora可以精细刻画阳光下湖面上光影的变化,以及具体复杂动作的表现逻辑、细节和特效,大大提升表达的真实感。

“AI识别-AI理解-AI意识”的演进,就如同人类在认识世界、理解世界、创造世界的成长过程。Sora作为文学生产的视频工具,大大降低了广告、短视频、游戏等行业的人工成本。比如2024年,人民日报客户端发布AI共创大片《乡村真美》,中央广播电视总台利用文生视频将全国统一语文教材中的诗歌制作成AI动画《千年诗篇》,AI带来视频生产力的快速提升。从科学的角度看,正如高文在鹏城实验室公众号发表的文章《人工智能前沿技术与高质量发展分析》中提到的,Sora是从通用人工智能走向人工智能通用智能的一个起点。

(二)“以AI保护AI”聚焦深度造假内容安全治理

随着人工智能生成内容的能力越来越强,其应用将颠覆“眼见为实”、“图为实”等传统认知。如何减少人工智能通过深度伪造生成虚假信息的滥用,不仅需要建立相关法律法规,监管也应利用“人工智能认证”对违法行为形成技术压制。

“AI认证”以AI保护AI,涵盖AI文本、图片、音频、视频等多模态内容的检测与识别,尤其针对人脸生成、替换、声音合成、表情迁移等技术生成的DeepFake内容的检测与识别。随着相关技术应用的深入,未来将有更加精准可靠的AIGC检测产品和服务。同时,媒体也开始关注模型的安全性,包括训练数据安全、模型防攻击、模型输入安全等。从训练到推理,都要紧握内容安全的“方向盘”,确保生成的内容正确指向、合法合规。

(三)用主流价值观缓解AI算法焦虑和流量焦虑

在人工智能技术的赋能下,机器能够基于算法、按照用户个人兴趣进行信息生产和分发。内容信息的选择标准和生产逻辑受到算法影响,用户注意力和流量成为判断内容价值的重要标准之一。过度发展往往导致信息过载或内容狭隘,缺乏情感温暖,一定程度上削弱了用户对主流报道和公共领域的关注。

构建主流价值观精准传播体系,用主流价值观引导算法、收割流量,是全国党媒平台持续深入实践的话题。技术上需要建立数据采集、特征工程、模型算法、推荐引擎、效果评估的完整架构与体系,形成闭环流程支撑运营对主流媒体进行精准受众分析,如用户特征、媒体接触习惯、信息偏好、界定认知圈等;在此过程中,加强智能内容审核与标签体系的能力建设,协助强化“守门人”机制;同时,不断拓展多终端分发渠道,采用算法推荐与专家推荐相结合的策略,提升主流价值观在用户侧的传播与到达精准度。

(四)人工智能版权对作品独创性与技术应用创新性的深刻探讨

随着人工智能生产和创作的作品不断涌现,对现行版权制度带来巨大挑战,并引发一系列悬而未决的人工智能版权纠纷。这些主要包括:在输入端的人工智能训练阶段,将有版权的作品作为训练数据;以及在输出端的人工智能使用阶段,通过人工智能二次创作创作的作品的版权如何在模型提供方和使用模型的创作者之间分配。例如,2023年11月,OpenAI被指控侵犯了11位非虚构类图书作者的版权,他们的作品训练大型语言模型;2024年2月,广州互联网法院判决,一家人工智能公司在提供生成式人工智能服务的同时,侵犯了原告对涉案奥特曼作品的复制权和改编权。

如何还原AIGC全生命周期中各参与方从输入端到输出端对AI作品的影响与贡献,并基于贡献形成合理合规的数据确权与普遍认可的权利划分原则,成为实践中面临的难题。可以预见,随着生成式AI对海量数据的学习和模仿,区块链技术将被内容创作者更加深入、广泛的运用,保护其作品的原创价值,通过版权追踪侵权行为,实现有效的维权。

四、结论

人工智能技术的兴起和广泛渗透,对各行各业产生了颠覆性影响,也给媒体生产、传播和产业发展带来了新的范式,催生了一系列典型应用”。在防范风险的前提下,点状人工智能应用将不断形成网格化、链条化、全球覆盖,成为构建全媒体传播体系、实现高质量发展的新型生产力,并逐渐成为未来媒体的基本形态。(参考文献略)

本文链接: http://01280.cn/2024/09/3536/ 转载请注明出处!