产品咨询热线:010-82002271
专利大数据挖掘-知识经济
时间:2014-06-26    来源:知了网    孙启鹏

摘要:眼下IT行业最火热的的词非大数据莫属,随着大数据时代到来,他已经影响到了我们的吃穿住行、经济、医疗、环境等方方面面的民生问题,甚至于,2009年在美国的H1N1爆发几周前,谷歌成功预测了H1N1在全美的传播范围,且具体到了所属州,因此美国成果避开此全球性传染病的大面积威胁;全国高考作文题目18卷中12卷的作文方向被百度大数据预测命中;截止17日已开场的14场世界杯胜率预测中命中10场。

    大数据本质上就是数据,其关键技术主要是:1)大数据存储和管理;2)大数据挖掘和智能分析。小编就最有升值价值的海量专利数据开始,先为您带来专利数据挖掘制作过程。

    知了网用的专利代码化数据是体量大、数据类别多的数据集,要让其成为有价值数据,就需要对其进行采集分类、提炼、组装、统计分析等流程,需要用到大数据挖掘技术,如相似度计算、分类聚类法、文本分析算法、命名实体识别等。


专利结构化数据:知了网用的最早的中国专利申请年为1985年,数据以代码化形式存在,格式千奇百怪,数据丢失频繁,重复数据量不计其数。如何能在如此恶劣环境下取得我们想要的数据,必须找到一个适用于大部分专利的模板样例库,定义出需要的内容,排除不需要的杂质,最终形成一种结构化数据,依托于大数据存储检索平台,将这些数据展现给用户。
    统计分析:当你面对一份专利记录时,能了解的信息也仅局限于该专利带来的权利要求等价值,而当你面对数以亿计专利数据时,则通过大数据分析挖掘手段将能得到高于数据本身的关联信息价值。如何能找到知识经济,这就要看是否有着强大的业务体系作为支撑,挖掘出市场需要的数据,诸如知了网目前对代理所信息的深度挖掘,通过强大的数据分析工具,找到最勤劳代理所、最具人气代理所、最博学代理所、最高质代理所等产品,以及专利法律状态分析,能实现专利预警分析产品、有价值专利数据等。
    结语:随着大数据挖掘日趋完善,人们在各领域的决策将基于数据挖掘和分析而做出,而不再基于经验和直觉。这会带来无数的机遇,能否抓住,就看今朝你是否准备好了。

产品咨询热线:010-82002271
版权所有:北京中知智慧科技有限公司          Copyright 2017 izhiliao.com.cn All Rights Reserved.     京ICP备13009620号-12     京ICP证150567号

京公网安备 11010802025092号