2015年度郑州市端瑞矿业机械有限公司销售收入与资产数据报告
发布时间:2016-04-01 05:10:17
发布时间:2016-04-01 05:10:17
word/media/image1.gif
中国产业洞察网
数据采集方法及步骤
1、 通过网络爬虫技术,获得1500万条企业的信息;
网络爬虫是一种按照一定的规则,自动地抓取互联网信息的程序或者脚本。它可以根据既定的抓取目标,有选择的访问互联网上的网页与相关的链接,从政府公开信息、媒体公开信息和社会公开信息中获取所需要的信息。实际上,多达80%的商业情报都以非结构化的自然语言文本的形式存在其中。通过网络爬虫技术,我们从公开信息中可以获得1500万条以上的企业名单及相关信息。
2、 通过大数据采集及分析技术,筛选出50万家营业额在2000万元以上的企业;
近年来互联网、云计算、物联网的迅猛发展,无所不在的移动设备、RFID、无线传感器每分每秒都在产生数据。通过多维度的交叉分析,能够从海量的、多样的、非结构化的大数据中发现隐藏其后的关联体系,提取出有价值的、线性化的信息,从而帮助不同行业管理人员深入了解企业情况,做出更好的决策。通过预处理、分布式存储、数据挖掘等大数据采集和分析技术,我们从网络爬虫技术获取的海量信息中可以筛选、整理出50万家营业额在2000万元以上的企业,作为我们的企业数据库。
3、 通过CATI呼叫中心对50万家企业进行电话访问,得到更详细的企业信息;
CATI即计算机辅助电话访问,是将现代高速发展的通讯技术及计算机信息处理技术应用于传统的电话访问所得到的产物。在进行电话访问时,须事先输入受访人的电话号码,由电脑按程序自动拨号,电话访问员在接通电话后不知道对方身份,只负责按规定访问内容进行访问对话。访问过程和内容可以实时录音,以确保调查访问内容的真实可靠。采用这种访问调查方式,具有调查内容客观真实、保密性强、访问效率高等特点。中国产业洞察网在北京和上海分别设有电话访问中心,强大的CATI系统能够进行全国范围的电话访问,可以满足覆盖全国定性、定量访问的重大项目。通过CATI系统,我们从大数据处理得到的50万家企业信息更加完善,包括企业名称、企业所在地、企业联系方式、销售收入、资产总额等等。
(公开课)2015年 初一数学第七章 平面直角坐标系课件7.2.2用坐标表示平移(2)
陕西83个县市最富最穷都是哪里
2012-2014年1季度甘肃省石墨及其他非金属矿物制品制造行业经营状况分析季报
陕西省安康市2014-2015学年八年级上学期期中考试英语试题
[优化方案]2014届高考数学 10.1 分类计数原理与分步计数原理随堂检测(含解析)
八年级英语下册Unit 6 Topic 1 Were going on a three-day visit to Mount Tai Section C学案
2006-2007学年度山东省莱州市第一学期期中考试生物试题及参考答案
《盗墓笔记》经典台词语录
云南省人民政府办公厅关于减免中小学校舍安全工程建设有关收费的通知
77 2014年人教版小学语文一年级上册识字二3《菜园里》第2课时ppt课件