【数据及调查报告】下载网址汇总:不断更新
时间:2023-07-03 21:48:01 | 来源:网站运营
时间:2023-07-03 21:48:01 来源:网站运营
【数据及调查报告】下载网址汇总:不断更新:可以将此页保存为你的书签方便使用,以后会继续更新。
目录
- 综合类数据网站
- 司法及公共安全
- 气象与环境
- 机器学习数据集
- 地理类数据平台
- 公共卫生类数据平台
- 互联网信息数据
- 商业相关
- 工具类网站推荐
- 除知网外的论文下载网站
1. 综合类数据网站
- 国家统计局官网 、国家数据
- 中国国家调查数据库CNSDA,这就是著名的【中国综合社会调查(CGSS)】的下载网址,目前可以下载的数据集为2003年至2015年。
中国综合社会调查(Chinese General Social Survey,CGSS),是中国第一个全国性、综合性、连续性的大型社会调查项目。目的是通过定期、系统地收集中国人与中国社会各个方面的数据,总结社会变迁的长期趋势,探讨具有重大理论和现实意义的社会议题,推动国内社会科学研究的开放性与共享性,为政府决策与国际比较研究提供数据资料。
- awesome public datasets,GitHub上的开源数据集锦,这个数据集有些链接已经失效了,想下载还是要提前下载下来存在自己的硬盘里。
- AWS Public Datasets,亚马逊开源数据集。
- kaggle,著名的数据网站,每年都会举办一些比赛。
2. 司法及公共安全
- 中国裁判文书网,国内公开司法数据首推,这个网站由于用爬虫的人太多,导致现在速度很慢已经影响正常使用,网站经常更新反爬策略。
- 司法数据 - 中华人民共和国最高人民法院,最高人民法院会经常出一些专题报告,但是数据不是很细,只能看看图表:
- 司法案例_北大法宝,除了裁判文书网外,北大法宝也是下载裁判文书的好地方,但是北大法宝需要机构购买权限才能下载。
- 无讼案例,提供免费数据库检索服务。
- Global Terrorism Database | Kaggle,这个关于【恐怖袭击】的数据库在公共安全领域还是很出名的。
- NationMaster,美国犯罪数据查询
- 美国青少年犯罪相关年份数据
- 美国统一犯罪报告(UCR)——在该网站上可获取美国犯罪方面的信息、数据和报告,多年来广受研究者和媒体引用。其中可以在Crime Data Explorer栏目下载各州的犯罪数据。
犯罪数据来自美国联邦调查局(FBI)的一个犯罪数据库,称为国家事件报告系统(NIBRS)。NIBRS根据大约18000个城市、大学和学院、县、州、部落和联邦执法机构的报告,在县一级按类别提供犯罪数据
- City of Denton Open Data,美国Denton市开放数据平台,可下载crime数据
- Credit Card Fraud Detection at Kaggle,信用卡诈骗数据,这个数据集记录了欧洲信用卡用户在2013年9月两天内的284,807次转账,其中有492起为信用卡诈骗。这个数据集是脱敏的,kaggle上没有对其二十多个数据作说明,但是我在ResearchGate的一篇回答中找到了其对应的数据说明文件。
- Chicago Data Portal - Public Safety - Crimes 2001 to present, 芝加哥从2001年至今的犯罪数据,在国内不能直接访问;
3. 气象与环境
- 中国气象数据网
- rp5.ru/ 世界243个国家的天气,这个网站包含世界243个国家的历史天气数据,中国包含6606个居民点天气。其中我下载过杭州的历史天气数据,包括气象站历史数据和机场历史数据,时间是从2015.1.1开始,数据格式可选择xls或csv。
- 中国空气质量在线监测分析平台历史数据,全国各省市PM2.5历史数据,可精确到每日的数据,时间从2013年12月开始。
- 美国环境保护署(EPA)的空气质量系统(AQS)监测网提供了美国各州可以衡量空气污染的表层PM2.5和Ozone浓度的空气质量数据,数据可以在此处下载。
- 野火烟雾数据来自美国国家海洋和大气管理局(The National Oceanic and Atmospheric Administration)的灾害测绘系统(Hazard Mapping System,HMS),该系统根据卫星图像原理,每天对全国范围内的烟雾进行估算,数据点击此处下载。
- 美国俄勒冈州立大学气候小组(Oregon State University Climate Group)开发的PRISM, 可以提取横跨整个美国大陆的每日最高温度(摄氏温度)、每日最低温度(摄氏温度)和每日降水量(毫米)的网格数据,其空间分辨率为4公里。
- 中国各省市日落日出时间查询:日落日出时间 数据为表格形式,不能直接导出,但是我之前用八爪鱼采集器可以很轻松的批量获取。
4. 机器学习数据集
UCI数据库(UCI Machine Learning Repository)是加州大学欧文分校(University of CaliforniaIrvine)提出的用于机器学习的数据库,这个数据库目前共有488个数据集,其数目还在不断增加,UCI数据集是一个常用的标准测试数据集。
- 用于训练中英文对话系统的语料库:Datasets for Training Chatbot System
- 中文公开聊天语料库:GitHub集锦 这应该是目前最全的公开聊天语料库了
5. 地理类数据平台
- 地理国情监测云平台,官方平台,会有一些免费的数据,但是注册的时候有些周折。
6. 公共卫生类数据平台
- 公共卫生科学数据中心,这个官方平台包含了一些传染性疾病的数据。
- 中华人民共和国国家卫生健康委员会,新冠疫情数据官方公布平台。
- COVID-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University,全球新冠疫情数据仓库。
- 2019新型冠状病毒疫情时间序列数据仓库,国内根据丁香园新冠疫情数据制作的爬虫数据仓库
7. 互联网信息数据
- 中国互联网络信息中心,每年的《中国互联网络发展状况统计报告》就是在这个网站发布的。
- 百度指数用的最多,其他的指数网站比如微指数、阿里指数等等没用过。
8. 商业相关
- 数据雷达,可以下载淘宝商品的交易量和交易金额的网站。
- 艾瑞咨询 研究报告。艾瑞咨询的一些研究报告可以免费下载,我在这个网站下载了2004至2019年《中国第三方支付数据发布》共30个文件,并结合中国人民银行支付结算司发布的2010年至2016年《中国支付体系发展报告》,对中国支付体系发展感兴趣的可以去文末下载。
9. 工具类网站推荐
- 快搜是包含了很多工具的一个网站,当然也包括一些推荐的数据网站
- HiPPTER,大数据查询导航网站
- 图怪兽-在线图片编辑器-在线PS抠图-图片制作-搞定平面设计不求人
- 美图秀秀网页版,网页版和windows单机版功能差不多
- 站长工具 - UrlEncode编码/UrlDecode解码
- UZER.ME -- 您的云端超级应用空间
- 1Checker(易改)- 校对、语法检查和智能润色
- 微软爱写作- Aim Writing - 微软小英写作网站
- 田间小站 - 经济学人官方译文(经济学人双语版 )归档
10.除知网外的论文下载网站
- 科技文献- 杭州研发公共服务平台
- 国家哲学社会科学学术期刊数据库
- 国家哲学社会科学文献中心
- iData-知识检索
- LabXing- LabXing 上可以免费创建课题组网站
- Bing 学术