建设高质量创新联合体******
本期光明网理论学术动态导读关注创新联合体、高等教育数字化、市场经济体制、科技文化自信等话题,欢迎网友踊跃参与讨论。
【邸晓燕:建设高质量创新联合体】
北京化工大学文法学院邸晓燕认为创新联合体是多主体联合攻关的有效组织形式,建设高质量创新联合体是实施创新驱动发展战略的一条有效途径。创新联合体一般由领军企业主导,联合产学研各方,通过产业技术创新战略联盟、平台、中心、实验室等形式开展联合创新活动。建设高质量创新联合体,可以提高国家创新体系的整体效能。一是提升跨产业的创新绩效。创新联合体的协作创新是一种开放创造和共享。利用创新联合体开展更具战略导向、跨产业、跨组织的合作,有利于通过协同创新提升创新绩效。二是推动创新链、人才链深度融合。通过共建实验室、合作开展项目等方式建设高质量创新联合体,加强企业主导的产学研深度融合,有利于激发创新者的创新潜能,有利于吸引和培养科技领军人才和创新团队,促进人才的合理布局和协调发展。三是有助于优化创新文化环境。在创新联合体内,各方能够形成和巩固彼此之间的信任关系,形成良好的创新文化环境。建设高质量创新联合体是一项系统工程,当前可以从以下三个方面着力。一是优化组织模式和运行机制。创新联合体涉及多个主体,需要协调不同层次的利益关系,建立新的协调与合作方式,推动跨学科、跨产业、跨领域的更广泛更多样化的合作。二是加大基础设施建设力度。三是为创新联合体提供市场机会、技术变革趋势等重要信息,营造良好政策支持环境,帮助创新联合体明确创新方向、把握创新机遇。
摘编自《人民日报》
【张卫国:以数字化变革推进高等教育提质增效】
西南大学校长、教授张卫国认为建设高质量高等教育体系,需要通过数字教育全面支撑学生学、教师教、学校管各环节,由此形成引领高等教育提质增效、创新发展的基础性力量。高等教育的数字化变革,应当从资源、平台、手段等维度入手,加快全领域、全流程、全要素转型升级,推进教育现代化,重塑高等教育格局。主要应从以下三个方面着手。一、基于“新形态”,构建“新生态”。为应对新冠肺炎疫情,我国实施了全球范围内最大规模的有组织在线教育,尽力保障高校在线课程开出率。信息技术日渐成为教育系统性变革的内生变量,数字教育成为一种新的教育形态,支撑着教育现代化的发展。发挥信息技术的优势,整合各种资源要素,加快推进技术应用与教育内容、平台终端、管理手段相融合,真正推动教育的理念更新、模式变革、体系重构。二、立足“新场景”,打造“新场域”。数字教育突破了物理的边界、技术的限制、身份的制约,为教师教、学生学打开了多种想象和可能,高等教育的场景更是无限。用好信息技术设施支撑的各类平台,建立具有物联化、感知化、泛在化特征的新型教育场域,促进教育环境的智能化转型。三、积聚“新线条”,集成“新链条”。现代教育已经从传统的教与学这种“一线两端”的形式,发展为一个循环系统,由多条线组成,不仅关系教、学、研,还涉及管、服、评,一个方面的水平往往会影响另一方面的质量。唯有由不同线条构成的“教育链条”融合协同,数字教育才有智慧,教育的效果才能显现。
摘编自《光明日报》
【丁茂战:构建高水平社会主义市场经济体制】
北京市习近平新时代中国特色社会主义思想研究中心丁茂战认为未来五年是全面建设社会主义现代化国家开局起步的关键时期,前进道路上,要牢牢把握重大原则,深入推进改革创新,着力破解深层次体制机制障碍,构建高水平社会主义市场经济体制,不断提高国家治理体系和治理能力现代化水平,不断彰显中国特色社会主义制度优势,不断增强社会主义现代化建设的动力和活力,把我国制度优势更好转化为国家治理效能。构建高水平社会主义市场经济体制应从三个方面入手。一是坚持和完善基本经济制度,激发市场主体活力。社会主义市场经济体制是中国特色社会主义的重大理论和实践创新,是社会主义基本经济制度的重要组成部分。要按照党的二十大报告部署,坚持和完善社会主义基本经济制度,毫不动摇巩固和发展公有制经济,毫不动摇鼓励、支持、引导非公有制经济发展。包括坚持和完善社会主义基本经济制度、加快国有经济布局优化和结构调整、深化国有企业改革、持续优化民营企业发展环境、积极支持中小微企业发展。二是要充分发挥市场决定性作用,构建全国统一市场。具体措施包括强化市场基础制度规则统一、加快要素市场化改革步伐、推进市场监管公平统一。三要更好发挥政府作用,健全宏观经济治理体系。要完善宏观经济治理、加快建立现代财税制度、深化金融体制改革。
摘编自《经济日报》
【杨怀中:新时代科技文化创新当坚定文化自信】
武汉理工大学马克思主义学院教授杨怀中认为新时代推进科技文化创新当坚定文化自信,没有文化自信,就不可能有科技文化创新。文化自信,是一个国家、一个民族对自身文化的优越性、生命力以及未来发展前景的坚定信念。新时代科技文化创新坚定文化自信,就是要将蕴含在优秀传统文化中的思想观念、思维方式乃至科技方法转化为现实的制度范式和直接的生产力,以文化自信推进科技文化创新。只有这样,我们才能在世界科技文化的博弈中,始终保持对自身科技文化理想、科技文化价值的坚定信念,保持对自身科技文化生命力、科技文化创造力的高度信心,不断增强我国科技文化话语权,提升国家科技文化软实力。中国是一个文化资源大国,也是一个科技文化资源大国。中国古代科技文化中的整体性思维、“天人合一”思想、经世致用理念以及人文情怀等,表征着中国古代科技文化的独特气质和品格,对于今天的科技文化创新发展仍然具有重要意义,也都是今天科技文化创新发展必须坚持和弘扬的基本精神。世界科技强国也一定是世界科技文化强国,建设世界科技强国需要坚强有力的科技文化的引领和支撑,实现高水平科技自立自强必须夯实科技文化根基。事实上,世界科技强国的崛起都是以科技文化的发展繁荣为前提和基础的,没有一流的科技文化,就不可能建成一流的科技强国。
摘编自《中国社会科学网》
(光明网记者李彬整理)
向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。