“中国智库索引”（CTTI）研制报告

2016-09-28 08:37:00 来源：光明日报作者:李刚、王斯敏、关琳、丁炫凯执笔

图1

图2

图3

图4

编者按

　　为更好地服务中国特色新型智库建设、弥补我国智库数据管理和在线评价工具的空白，由南京大学中国智库研究与评价中心、光明日报智库研究与发布中心联合研发的“中国智库索引”（简称CTTI），于9月28日正式上线。为使广大读者和用户全面、深入了解CTTI有关情况，兹发布此研制报告。

　　1、研发背景

　　党的十八大和十八届三中全会要求加强中国特色新型智库建设，建立健全决策咨询制度，启动了智库建设的国家战略。此后，我国新型智库的发展迎来了一个黄金时期。

　　然而，直到目前我国还没有建立起一套完整的智库情况统计分析方法。科技部曾在2011年组织开展过一次“全国软科学研究机构统计调查报告”，统计结果是中国共有各类型软科学研究机构2408家。谢寿光、蔡继辉主编的《中国智库名录》登记了1137家智库（不包含港澳台）。2016年1月上海社会科学院智库研究中心发布的《2015年中国智库报告》，认为中国的活跃智库有300余家。可见，对于中国到底有多少家智库，意见差别很大。缺乏智库统计指标体系是导致我国没有完整系统的智库统计数据的主要原因。这不仅不利于各级政府对辖区内建设中国特色新型智库发展态势的掌握，也影响各级政府在科学决策过程中对智库资源的利用，而且使我国的智库评估评价等智库管理和研究缺乏必要的数据支撑。

　　为了记录、保存、集成智库信息，美国哈佛大学肯尼迪政府学院图书馆提供了专门的“智库搜索”检索工具，对智库的检索，准确率几乎提升了一个数量级。Lynn John Hellebust和Kristen Page Hellebust编辑出版的《智库名录：独立非营利政策研究机构指南》是美国智库研究的权威工具书。但是，肯尼迪政府学院图书馆的智库搜索没有自己独立的索引库，是谷歌为它定制的垂直搜索引擎。而《智库名录》只记录智库基本信息，包含了13个字段。

　　为解决全面描述、全面收集智库数据，提供数据整理、数据检索、数据分析、数据应用的功能，南京大学中国智库研究与评价中心联合光明日报智库研究与发布中心开展了“中国智库索引”（简称CTTI）的研究开发工作。2015年6月成立了以李刚教授为主持人的课题组，系统研发经历三个阶段。2015年6月至10月属于第一阶段，完成了系统需求分析、字段设计，确定了系统设计的基本思想，明确了系统架构设计。在10月18日由光明日报理论部和南京大学共同主办的“新型智库机构评估与治理创新专题研讨会”上发布了CTTI的中期研究成果，被业内视为2015年智库界十大事件之一。2015年11月至2016年6月属于系统开发的第二阶段，完成了CTTI的系统开发。2016年7月至9月属于第三阶段，这一阶段完成了系统环境部署，上线内测，以及委托第三方测试系统安全性等工作。9月28日上线发布，可以开放给被收录的来源智库录入数据。

　　2、目标与设计理念

　　CTTI的基本目标和需求有三个。第一，对新型智库的各要素进行准确“画像”，力求全面准确描述和反映智库的基础信息、人员、成果、活动、影响力等诸方面的情况。第二，以完备的字段作为支撑，以多角度查询的方式全方位展示查询结果，实现对智库机构从内部架构到外部活动、从人员组成到成果发布的立体式展示。用户（政府、企业事业单位、社会团体等）有大量的政策研究、咨询需求，但是它们未必知道谁是最恰当的解决方案提供者，而智库也经常处于任务不足，不知道客户在哪里的情形。CTTI设计目标之一就是解决这种信息不对称情况。第三，为新型智库评估评价提供针对性的基础数据。

　　根据基本目标，课题组确定了相应的设计理念和设计要求。

　　第一，智库“画像”和专家“画像”必须全面准确，要从多个维度对智库和专家各要素进行描述，字段设计宁可冗余，也不能出现有数据而无对应的字段的情况。

　　第二，把这一在线大型数据库设计成为一个智库的“垂直搜索引擎”（专业搜索），实现对智库各种信息的智能分析，快速准确检索到目标信息。比如某机构发布需求需要寻求计划生育方面的研究专家，那么我们就可以锁定研究领域为计划生育的专家，根据对他们年度成果、活动的评价，进行排名选择。

　　第三，对接智库评价的新理念。CTTI不是单纯的智库数据管理系统，还有智库评价，这是后期数据应用的主要目的之一。对于智库评价，目前主要有两种方式：一是影响力评价，比如上海社科院的评价体系；二是资源—绩效评价，比如麦甘的《全球智库报告》，中国社科院的AMI全球智库综合评价模型也属于资源—绩效评价。它们的共同点是都属于“分值评价模型”，根据分值（这个分值可能来自专家问卷，也可能来自一些定量数据）的大小进行排名。大部分排行榜都只取少数几个因素来排名。我们在设计CTTI的时候，考虑到构建的评价模型必须是一种多因子评价模型。CTTI评价因子不是几个，而是几十个甚至上百个。另外，CTTI评价模型是一种学习模型，具有智能分析评价的特征，不是简单地算一个分值，给出排名，而是具备自主根据评价对象的不同，自动进行权重赋值。CTTI评价模型也不仅是一个模型、一个算法，而是准备开发出一组模型、一组算法，根据不同的评价目的调用不同的算法，这样可以使评价更具针对性和个性化。为了实现评价上的突破，CTTI的设计理念也将不断追求更新与突破。

　　第四，确保数据安全，争取达到准金融数据安全级别。CTTI由底层数据库和顶层应用系统两部分组成。为达到CTTI的预期目标，在进行框架安排和功能设计时，采用底层数据库字段做加法，顶层功能设计做减法，后台管理系统做加法，前台应用系统做减法的设计思想。一方面使得CTTI的数据字段和数据库设计较为完备，另一方面使其顶层功能和前台应用可面向未来需要做灵活扩充。

　　从用户角度区分，CTTI的应用系统如图1所示，分别是检索模块、机构应用模块、专家应用模块以及后台管理模块。

江苏智库

MORE聚焦前沿

MORE智库专家

MORE专刊专栏