扫一扫  加微信
我国首个智库垂直搜索引擎和数据管理平台正式发布
2016-12-19 14:29:00  来源:江苏智库网  作者:韦轶婷

 

  2016年12月17日,在2016中国智库治理论坛上,南京大学中国智库研究与评价中心和光明日报智库研究与发布中心发布了双方共同研发的我国首个智库垂直搜索引擎和数据管理平台CTTI。光明日报智库版主编、光明日报智库研究与发布中心副主任王斯敏发布CTTI来源智库(2017-2018)入围名单;南京大学中国智库研究与评价中心首席专家李刚发布CTTI来源智库效能报告。

  丰富多样的政策思想供给体系初步形成

  光明日报智库版主编、光明日报智库研究与发布中心副主任王斯敏介绍,CTTI来源智库(2017-2018)入围名单中,北京、上海、江苏占据入围智库的前三位,其中作为科研重地,部委众多、高校云集、研究力量雄厚的北京地区,共有173家机构入选,占所有入选机构的35.16%。广东、湖北、陕西、湖南等省份入围智库也相对集中。这一地域分布和我国的科教资源分布相一致,说明了智库的科教属性。

  在489家来源智库中,高校智库共有255家,占52%;党政部门智库68家,占15%;社科院智库46家,占9%;党校行政学院智库44家,占9%;社会智库36家,占7%;媒体智库11家,占2%。由于高校系统学科实力雄厚,占据了人才优势,高校智库占据来源智库半壁江山并不奇怪。教育部1999年以来在全国66所高等学校相继设立了151个人文社科重点研究基地,经过多年培育,成为各大高校实体化运行的研究重镇。其中部分基地原本就发挥着智库作用,为党和政府提供了大量的决策咨询服务。

  随着智库意识的加强,社会科学研究问题导向的确立,人文社科重点研究基地和部分2011协同创新中心,正快速智库化。

  党政部门智库是我国智库共同体的主力和核心,入选的72家智库大部分属于中央部委的决策咨询事业单位,一直发挥着智库的作用。

  王斯敏强调,令人欣喜的是社会智库和媒体智库的异军突起,说明了我国智库共同体构成愈加合理,丰富多样的政策思想供给体系初步形成。

  对新型智库精准“画像”:消除供与需之间的“信息不对称”

  南京大学中国智库研究与评价中心首席专家李刚介绍,CTTI力求全面准确地描述和反映智库的基础信息、人员、成果、活动、影响力等方面情况,对新型智库的各要素进行准确“画像”,进而消除智库和用户之间的“信息不对称”。同时,在CTTI强大的数据支撑下,中国智库研究将打破 “宾大报告”的“垄断”格局,为我国新型智库评估评价提供具有针对性的基础数据。

  CTTI以完备的字段作为支撑,以多角度查询的方式全方位展示查询结果,实现对智库机构从内部架构到外部活动、从人员组成到成果发布的立体式展示。

  李刚强调,CTTI的设计理念、功能布局、数据采集机制、评价机制等均为自主提出,是基于中国体制优势的自主创新,主要体现在:

  第一,CTTI建立了共建共享的数据采集机制,重视数据的客观性和准确性。CTTI的数据采集有三种形式:(1)依靠来源智库和专家自主填报;(2)南京大学中国智库研究与评价中心手工收集;(3)网上数据自动抓取。目前第一种方式是主流,数据由智库机构管理员或者专家本人录入,提交给CTTI后台审核,每一条数据都经过后台审核准确无误才提交到数据库。这种数据采集机制采用了时下最流行的“众包”(众筹)模式,数据共建共享,由于是人工模式,数据的准确性和客观性大大增强。为减少干扰影响力数据的情况,CTTI每个智库每位专家的影响力数值除后台管理员填报的少数字段外,都是根据填报的数据自动计算出影响力数值的。

  第二,CTTI的UI设计和用户体验达到了同类产品的前沿水平。比如,CTTI允许几百上千人同时录入数据,由于现代科研中合作研究是一种常态,目前发现的合作者最多的一篇高能物理方面的论文有作者5000多个,那么一定会出现同一篇文献不同专家不同智库先后录入各自名下这种情况。在CTTI中录入数据时,只要出现关联数据,系统就会自动拉取原来存在的数据,让最近的录入者修改补充。这样不仅杜绝了雷同数据,而且节省了数据录入量。再比如CTTI在数据录入界面设计了大量醒目的按钮,用户可以随时保存、修改、调用数据,杜绝了因误操作丢失数据的情况。另外,CTTI几乎为每个字段都提供了数据录入提示语,提示语不仅解释了字段的含义,而且给出了示例。这样数据录入人员无需查阅系统说明书就可以知道如何准确地录入数据。

  第三,CTTI系统和数据安全性达到了准金融数据安全级别。在部署方案上,CTTI将应用服务器与数据服务器分开部署,采用内外网隔离的方案,公网用户只能访问应用服务器,无法直接访问到数据服务器,保证了数据的安全性;在通讯协议方面,CTTI使用https的SSL加密协议,保证所有请求数据在传输的过程中都是加密的,防止攻击者通过拦截篡改请求内容非法访问系统;由于CTTI收录的数据众多,为了防止系统数据被窃取,CTTI在反扒网方面也做了应对设计,采用B/S架构并以科学的权限设置和角色分配保障信息的可用性和可控性,一般访客访问系统只能查询到最基本的数据,无法看到系统的全貌,后续我们也将对客户端IP访问频率增加限制,避免出现非人为操作的破坏性攻击。

  第四,CTTI创新了用户分层服务模式。CTTI的用户有需要利用智库的党和政府的政策研究机构;有负责智库注册和指导工作的民政局、宣传部等部门;有智库管理员和专家等机构内部用户;有大学、媒体、科研院所等学术宣传单位;有各种企业等营利部门,还有一般的公众。CTTI设计了分层服务方案,不同层次的用户,访问到的数据层次和类型不同,给予不同用户针对性的服务。比如,各种统计图标、统计工具在设计时就充分考虑了行政管理部门的需要。在数据的呈现与导出方面,充分考虑了智库的需要,智库和专家可以方便地在CTTI中进行数据管理与导出。又比如为了方便系统管理员的风险应急管理,CTTI提供了瞬间关闭某一个智库全部数据而不影响其他智库数据的功能。这样即使个别智库数据出现敏感问题,也不需要关闭整个系统。

  第五,CTTI在一定意义上建立了中国特色新型智库的统计指标体系和元数据标准。全部的871个字段实现了对智库基本信息、专家信息、成果信息、活动信息的各种属性的全面覆盖,给出了立体的智库各要素“画像”。这些数据字段可以成为今后其他智库系统开发的元数据。(记者 韦轶婷)

(转载需注明来源:江苏智库网)
  编辑:韦轶婷