2018年底前建成国家政府数据统一开放平台,率先在信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象、海洋、企业登记监管等重要领域实现公共数据资源合理适度向社会开放。
——《促进大数据发展行动纲要》 国务院 2015
这里汇集了全球各个门类(与空间数据相关)的开放数据来源,请善用站内搜索查找您感兴趣的数据源,数据目录在不断更新完善中。
如您有数据源希望共享欢迎在下方留言或给我发邮件,投稿格式:* [数据名称] (链接)-备注或说明
地理综合
中国
OSGeo中国-OSGeo中国中心,开放地理空间实验室,关注开源GIS技术,地理空间数据共享!
China Dimensions Data Collection-GIS data including administrative regions, census data linked to maps and agricultural data.
Diamond Bay Data-Chinese counties, census statistics and Digital Chart of the World China GIS layers.
China Historical GIS-Historical boundaries, tribal areas etc for China from 1820 back to 222 BCE.
美国
- US GIS Data-
- GeoLite Legacy Downloadable Databases-IP地理定位数据库
- USGS-美国地质调查局
- US National Atlas-All raw data contained in the National Altas is available for downloading including everything from agricultural census data, presidential election results, airports, railways, glaciers, arsenic content in groundwater, and much more.
- USGS Historical Topographic Maps-Electronic copies of USGS Topographic Maps from the last 125 years. Provided in GeoPDF format, which isn’t great for importing into GIS software, but apparently can be converted to GeoTIFF in the latest version of GDAL
- National Geophysical Data Center-List of all free data from the NGDC - sorted alphabetically not by category, but includes elevation models, land cover, seismology and more.
- North American Environmental Atlas-Environmental data for the whole of the North American continent, including land cover, pollution, climate, ecosystems, human influence and protected species, in raster and vector formats.
- US Cartographic Boundaries-Cartographic boundaries, including city boundaries, counties, school districts, voting districts, zip code areas and congressional districts. Mainly from the 2000 census, but some later data.
- NOAA Medium Resolution Digital Vector Shoreline-US coastlines compiled from official NOAA coastal charts covering nearly 75,000 nautical miles of coastline.
- Office of Coast Survey Chart Downloader-Free access to NOAA marine navigational charts.
地区
- Arkansas-
- California-
- Connecticut LiDAR DEM-3m resolution DEM for the state of Connecticut. Can be downloaded by town or by geographic quadrangle.
- Florida Geographic Data-Florida Geographic Data Library Explorer
- Georgia GIS Clearinghouse-
- Hawaii High Resolution Land Cover-Land cover maps for all Hawaiian islands apart from the Big Island, for 1992, 2001 and 2005. 1992 and 2001 data are from Landsat, 2005 from 2.4m Quickbird.
- IndianaMAP-
- Indiana Spatial Data Portal-
- Iowa Natural Resources GIS Library-State-wide data on natural resources including geology, agriculture, hydrology and land cover.
- Kansas GIS Data Access and Support Center-
- Kentucky Geoportal-
- Louisiana State Atlas-
- Maine Office of GIS-
- Montana Data List-
- Massachusetts GIS Layers-
- Michigan Center for Geographic Information-
- Minnesota Geospatial Commons-
- Mississippi Geospatial Clearinghouse-
- New York State GIS Clearinghouse-
- New Mexico Resource GIS program-
- North Carolina OneMap-
- Ohio Geographically Referenced Information Program-
- Oklahoma Water Resources Board GIS data-
- Oregon Spatial Data Library-
- Pennsylvania Spatial Data Access-
- Tennessee Enterprise GIS Portal-
- Tennessee State Parks data-
- Texas Natural Resources Information System-
- Texas University Libraries GIS data-
- Utah GIS Portal-
- Vermont Center for Geographic Information-
- Virginia GIS Clearinghouse-
- Virginia Department of Forestry-
- Washington State Department of Transport-Various transport-related datasets for Washington including airports, ferry routes, railways and traffic counts. Also includes some non-transport data including relief, national scenic areas and major lakes.
- West Virginia GIS Technical Centre-
- Wisconsin State Cartographer’s Office-
- Wyoming GIS-
- New York City GIS-Data specific to New York city including building footprints, street centrelines, pavement edges, open space, railways, shorelines and elevation. All provided as shapefiles and MapInfo files.
- Bytes of the Big Apple-Linear basemaps, zoning information and areas of particular planning interest for New York City.
- Washington DC GIS Clearinghouse-GIS data from the city of Washington DC including base maps, POI locations, street plans and much more.
- 3D models of Boston-Building footprints and 3D models of a large part of Boston.
- Chesapeake Bay Program-GIS data for Chesapeake Bay, including water quality and ecology datasets.
- MyCity Houston-
- Houston Open Data-
- Harris County GIS data-
- Wake County, North Carolina-Open data portal for Wake County, North Carolina. Runs on the ArcGIS Online platform, but most datasets are available for download as shapefiles or KMLs.
- Los Angeles County GIS Data Portal-Open GIS data portal for Los Angeles County with a wide range of data.
- Southern California Association of Governments GIS & Data Services-GIS data portal for a group of Southern Californian local governments
全球/其他国家
- GADM-全球行政区数据库(注意!中国行政边界有问题)
- world.geo.json-全球地理GeoJSON数据
- Natural Earth Data-Includes coastline, land, oceans, islands, rivers, lakes, glaciated areas and bathymetry. Available at multiple levels of detail. A version of this data is also available in the Wagner VII projection, which has good equal area properties
- Geocomm-
- Geonames data-
- Global Map-A set of consistent GIS layers covering the whole globe at 1km resolution including: transportation, elevation, drainage, vegetation, administrative boundaries, land cover, land use and population centres. Produced by the International Steering Committee on Global Mapping.
- DIVA-GIS Country Data-A collection of data collected from a number of the sources below - includes administrative areas, inland water, roads and railways, elevation, land cover, population and climate. Probably the easiest place to get a simple set of data for a specific country.
- UNEP GEOdata-A wide range of data from the United Nations Environment Programme including Global Forest Cover, Global Potential Evapotranspiration, Global Average Monthly Temperatures, Dams, Watershed Boundaries and much more. To get data, choose Advanced Search and select Geospatial Data Sets from the top drop-down link
- Koordinates-GIS data aggregation site including data in a number of categories such as elevation, environment, climate etc. Some global datasets, some based on continents, some for specific countries. Mostly vector, but some raster.
- MapCruzin-GIS aggregation site including wide range of data for various areas of the world. Some datasets appears to be of low quality, but others are good.
- GeoNetwork-GIS aggregation site including a wide range of data under various categories (both human and physical).
- GSHHS-A Global Self-consistent, Hierarchical, High-resolution Shoreline Database - which basically means it’s good quality (no internal inconsistencies, good accuracy).
- World Borders-World country borders with attributes including country codes (FIPS, ISO etc), area and populations.
- Europe in the World-Administrative boundaries for Europe with lots of attribute data for each country/region including (This contents are copy from ealen) information on economy, demography and infrastructure.
- CShapes - Historical Boundaries-Historical state boundaries and capitals post-WW2, world-wide, including all changes and dates of changes.
- VLIZ Maritime Boundaries-Maritime boundaries and areas of Exclusive Economic Zones, including detailed attribute data on treaties etc. From the Flanders Marine Institute.
- TZ timezones-A map of timezone areas in the world as used in the Unix TZ database format, from which we get the naming Europe/London, America/New_York etc. In shapefile format.
地形/地质
全球
- GDEM-30米分辨率 derived from ASTER satellite images
- SRTM-90米分辨率(3 arc-second) from the Shuttle Radar Topography Mission for most of the world. Same data as next item, but with a nice download interface.官网: http://srtm.csi.cgiar.org/
- EarthEnv-DEM90-90m-resolution near-global DEM created by merging the GDEM and SRTM products and post-processing to fill voids and smooth data.
- ETOPO1-1 arc-minute resolution relief model including ocean bathymetry.
- Global Multi-Resolution Topography-Gridded elevation at approximately 100m resolution, covering terrestrial and sea-floor topography.
- MERIT DEM-Multi-Error-Removed Improved-Terrain DEM, created by removing multiple different types of errors from existing DEMs including SRTM. Available by emailing the developer for a password.
- ArcticDEM-Detailed elevation models of all land areas greater than 60 degrees north, generated using photogrammetry from high-res satellite images.
- Orrbodies Geology maps-地质数据集,A wide range of geology maps, for many different countries. Lots of free datasets on this site, but some commercial too.
- NOAA Data Access Viewer-土地覆盖影像,高程数据
- NOAA Digital Coast-NOAA数字海岸数据
地区
- EU-DEM-25m-resolution DEM covering the whole of Europe, available for download in tiles
- OpenTopography-A community-based site giving free access to high-resolution topography data. Data at the moment appears to be clustered on the West Coast of the USA and in Greenland, and is available both as dense point clouds and processed DEMs.
美国
- National Elevation Dataset-Regularly updated DEM for the whole of the US, Puerto Rico and the Virgin Islands. Varies from 10m-30m resolution, using best available data for each region.
- Great Lakes Bathymetry-Detailed bathymetry data for the Great Lakes at 3 arc-second resolution. To download data click the Create Custom Grids and fill in the areas you want.
- Coastal Relief-Various coastal DEMs of the USA at various resolutions. Whole US coastline combining bathymetry and land elevation out to the end of the continental slope is available at 3 arc-second resolution, and various areas available at higher resolution.
- Pudget Sound Lidar Consortium-Public-domain high-resolution LiDAR dataset for the Pacific Northwest.
- Geological maps of the US states-Detailed geological maps with extended attribute data for each of the US states. To download data select the state, then the area, then click the reference link at the bottom. Scroll down to the bottom and the files are available for download.
- Geology of the conterminous US-Similar to the above but in one file for the coterminous US, not including Hawaii and Alaska. Far easier to download than the above.
- Magnetic Anomalies-Airborne measurement of magnetic anomalies across the whole of North America, in raster format.
- USGS EnergyVision-Maps of various factors relating to energy use in the USA, the most relevant of which is the USA and world-wide geological maps. To download, view the web map, then click on the dropdown box labelled MORE and scroll to the Download GIS data option.
- PRIO Resource Datasets-Petroleum and diamond resource maps, globally.
遥感
免费
- NASA-美国宇航局
- GEE-Google Earth Engine,这是个遥感大杀器,啥都有!
- 高分辨率对地观测系统-广东数据与应用中心,当然还有其它省份或单位的应该都有对应系统,有国产高分数据,数据是免费的,但是要符合资格的用户才能申请使用。
- ESA-欧空局
- USGS Earth Explorer-包括Landsat系列,ASTER DEM , Hyperion高光谱,MODIS , AVHRR
- ESA’s Sentinel Mission-哨兵Sentinel系列
- NOAA CLASS-大气数据,包括美国国防部(DoD)的极地作战环境卫星(POES),NOAA的地球静止环境卫星(GOES)等以及衍生数据。
- Earth Observation Link (EOLi)-数据:包括Envisat, ERS, IKONOS, DMC, ALOS, SPOT, Kompsat, Proba, IRS, SCISAT.
- National Institute for Space Research (INPE)-数据:中巴资源卫星数据 CBERS-2, CBERS-2b
- Bhuvan Indian Geo-Platform of ISRO-数据:印度遥感卫星数据 IMS-1 (Hyperspectral), Cartosat, OceanSat and ResourceSat
- JAXA’s Global ALOS 3D World-数据:全球海拔DSM数据 ,分辨率为30m
- VITO Vision-数据:低分辨率地表植被影像数据,包括 PROBA-V, SPOT-Vegetation and METOP 卫星数据
- Global Land Cover Facility-土地覆盖数据,包括Landsat,MODIS,AVHRR卫星等数据
- DigitalGlobe Free Product Samples-WorldView-3卫星0.3m分辨率样品数据
- BlackBridge/Geo-Airbus- SPOT, Pleiades, RapidEye and TerraSAR 等卫星样品数据
- UNAVCO Research Data-SAR数据
- 上帝之眼-一些免费样例影像
商业卫星
- 中景视图-WorldView、QuickBird等高分影像;历史遥感影像代理
- 中国遥感数据网-中国科学院遥感与数字地球研究所(简称遥感地球所)在中国科学院遥感应用研究所、中国科学院对地观测与数字地球科学中心基础上组建,于2012年9月7日成立,为中国科学院直属综合性科研机构。
- 中国资源卫星应用中心-国产高分数据
- 吉林一号-吉林一号高分卫星
- 珠海一号-珠海一号星座数据(尚未公开发售)
标准数据集(用于验证算法)
此类目的内容转载自中山大学遥感大数据智能挖掘与分析(Intelligent Mining and Analysis of Remote Sensing Dig Data)研究组公众号。遥感目标检测
遥感图像目标检测是在遥感图像中搜索定位感兴趣的目标,并进行识别和确认的过程。其应用意义在于利用计算机视觉方法大大减少了人力资本的消耗,能够获取关于目标的定量描述信息,在国防军事建设、自然科学研究领域有着广泛的应用和发展前景。 - RSOD-RSOD是一个开放的目标检测数据集,用于遥感图像中的目标检测。数据集包含飞机,油箱,运动场和立交桥,以PASCAL VOC数据集的格式进行标注。数据集包括4个文件夹,每个文件夹包含一种对象:1.飞机数据集,446幅图像中的4993架飞机。2.操场,189副图像中的191个操场。3.立交桥,176副图像中的180座立交桥。4.油箱,165副图像中的1586个 油箱。
- NWPU VHR-10-仅用于研究的公开提供的10类地理空间物体检测数据集,这十类物体是飞机,轮船,储罐,棒球,网球场,篮球场,地面跑道,港口,桥梁和车辆。此数据集总共包含800幅超高分辨率(VHR)遥感图像,是从Google Earth和Vaihingen数据集裁剪而来的,然后由专家手动注释。
- 航空影像中的车辆检测(VEDAI)-VEDAI是航空影像中车辆检测的数据集,作为一种在不受限制的环境中对目标检测算法进行基准测试的工具。数据库中除了包含很小的车辆以外,还表现出不同的可变性,例如多个方向,光照/阴影变化,镜面反射或遮挡。此外,每个图像都有几个光谱带和分辨率。作者还给出了精确的实验方案,以确保可以正确复现和比较不同人获得的实验结果。对于这些算法的不同设置,作者还给出了一些基准以测试该数据集上的性能,以提供基准比较。
- 带上下文信息的高架汽车(COWC)-COWC数据是头顶视角的带注释的汽车。对于训练、深度神经网络以学习目标检测检测或汽车计数很有用。数据集具有以下属性:(1)地面上每像素分辨率15 cm的数据(所有数据均为EO)。(2)来自六个不同位置的数据:加拿大多伦多,新西兰塞尔温,波茨坦和德国Vaihingen,哥伦布和犹他州美国。(3)32,716辆带注释的汽车。58,247个负面例子。(4)为检测和计数任务建立基准。(5)能够验证额外测试场景。
- DOTA-DOTA是用于航空图像中目标检测的大规模数据集。它可以用于开发和评估航空影像中的物体检测。对于DOTA数据集,它包含来自不同传感器和平台的2806个航拍图像。每个图像的大小在大约800×800到4000×4000像素的范围内,并且包含各种比例,方向和形状的对象。这些DOTA图像由航空影像解释专家分类为15个常见对象类别。完全注释的DOTA图像包含188、282个实例,每个实例都由任意(8自由度)四边形标记。
- ITCVD-ITCVD数据集图像是从飞机平台拍摄的,图像拍摄由飞机在荷兰Enschede上方空高约330m的高度飞行,以天底视图和斜视图拍摄图像。斜视角的倾斜角度为45度。天底图像的地面采样距离(GSD)为10厘米。数据集包含用于训练的135张图像和用于测试的23543张图像,其余的38张图像和5545辆车辆用于测试。数据集中的每辆车都使用一个边界框手动标注,该边界框表示为(x,y,w,h),其中(x,y)是该框左上角的坐标,而(w,h )分别是边界框的宽度和高度。
- DIUx xView 2018检测挑战-xView是最大的公开可用的开销图像集之一。它包含来自世界各地复杂场景的图像,并用超过一百万个边界框进行注释,这些边界框代表60种对象类别的不同范围。与其他架空图像数据集相比,xView图像具有高分辨率,多光谱特性,并带有更多种类的对象标记。DIUx xView挑战赛的重点是加快四个计算机视觉领域的进展:降低检测的最小分辨率;提高学习效率;启用更多对象类的发现;改进对细粒度类的检测。DIUx xView挑战紧随挑战的脚步,例如上下文中的通用对象(COCO),并试图建立SpaceNet和世界功能图(FMoW),以将计算机视觉应用于来自太空可用图像,以便我们以新的方式理解视觉世界并解决一系列重要的问题。
- 2016年高分辨率船舶数据集(HRSC2016)-数据集所有图像均来自六个著名的港口。图像分辨率在2-m和0.4-m之间。图像尺寸范围从300到1500,大多数图像大于1000 x 600。训练,验证和测试集分别包含436个图像(包括1207个样本),181个图像(包括541个样本)和444个图像(包括1228个样本)。
- OpenSARShip-OpenSAR是由上海交通大学高级传感技术中心(AST)开发的开放式SAR图像管理和处理平台,用于SAR图像的读取,处理,可视化和算法测试。SAR图像管理和算法测试是OpenSAR的主要任务。OpenSAR支持导入各种SAR数据源,例如TerraSAR-X,RADARSAT 1/2,COSMO-SkyMed等。用户可以通过该平台搜索和查看SAR图像数据。OpenSAR支持注册各种算法,例如图像去噪,场景分类,目标检测,目标识别,变化检测等。用户可以通过该平台搜索,配置和执行这些算法,并且完整的测试报告也将提供给用户。
- 高分辨率SAR舰船检测数据集-1.0-高分辨率SAR舰船检测数据集-1.0(AIR-SARShip-1.0)首批发布31幅图像,图像分辨率包括1m和3m,成像模式包括聚束式和条带式,极化方式为单极化,场景类型包含港口、岛礁、不同等级海况的海面,目标覆盖运输船、油船、渔船等十余类近千艘舰船。图像尺寸约为3000×3000像素,图像格式为Tiff、单通道、8/16位图像深度,标注文件提供相应图像的长宽尺寸、标注目标的类别以及标注矩形框的位置。
场景分类
近年来,随着遥感成像技术的飞速发展,人们可以获得越来越多的不同分辨率的遥感影像。这些遥感影像具有观测范围广、获取周期短、包含地表信息丰富等点。遥感图像场景分类有利于对海量的高分辨率遥感影像的语义内容进行解译,并能提供相关信息指导目标识别和目标检测等实际问题。场景分类的准确性直接决定了遥感图像场景解译质量的高低。近年来,卷积神经网络(ConvolutionalNeural Network,CNN)因其能提取抽象、高阶的特征而广泛应用于图像分类中,而深度学习模型的训练需要人工标记数据集的支撑,经过近十年的发展,业界也对于数据集的标注工作做出了相当多的努力。 - UC Merced Land Use Dataset-这是一个用于研究目的的21类土地利用图像数据集。以下每个类有100张图像:Agricultural, airplane, baseball diamond, beach, buildings, chaparral, dense residential, forest, freeway, golf course, harbor, intersection, medium residential, mobile home park, overpass, parking lot, river, runway, sparse residential, storage tanks, tennis court。每张图像的大小是256x256。这些图像是从USGU国家地图城市区域图像集的大型图像中手动提取的,这些图像用于全国各地的城市区域。这个公开数据集的像素分辨率是1英尺。参考文献:Yi Yang and Shawn Newsam, “Bag-Of-Visual-Words and Spatial Extensions for Land-Use Classification,” ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems (ACM GIS), 2010.
- WHU-RS19-WHU-RS19是从谷歌卫星影像上获取的19类遥感影像,可用于场景分类和检索。参考文献:G.-S. Xia, W. Yang, J. Delon, Y. Gousseau. H. Maitre, H. Sun, “Structural high-resolution satellite image indexing”. Symposium: 100 Years ISPRS - Advancing Remote Sensing Science: Vienna, Austria, 2010
- RSSCN7-此数据集包含2800张遥感图像,这些图像来自7种典型场景类别:草地,森林,农田,停车场,住宅区,工业区以及河湖。对于每个类别,有400张从谷歌地球上采样收集的图像,分为四个不同的尺度,每个尺度100张图像,每个图像的大小为400 * 400。由于场景图像的多样性,这一数据集具有相当大的挑战性,这些图像是在季节变化和天气变化的情况下拍摄的,并以不同的比例进行采样。参考文献:Qin Zou, Lihao Ni, Tong Zhang and Qian Wang, Deep learning based feature selection for remote sensing scene classification, IEEE Geoscience and Remote Sensing Letters, vol. 12, no. 11, pp.2321-2325, 2015.
- SAT-4 and SAT-6 airborne datasets-图像是从国家农业影像计划(NAIP)数据集中提取的。NAIP数据集包括横跨整个美国大陆(CONUS)的330,000个场景。我们使用了格式为GeoTIFF的未压缩数字正射影像的四分之一方块(DOQQ),并且该区域对应于美国地质调查局(USGS)地形四边形。这些图像的平均宽度约为6000像素,高度约为7000像素,每个图像块约200兆字节大小。CONUS的整个NAIP数据集约为65 TB。图像是在地面采样距离(GSD)约1m上获取的,水平精度位于相片可识别的地面控制点六米以内。图像由4个波段组成:红,绿,蓝和近红外波段。为了维持整个NAIP数据集固有的高方差,我们从覆盖不同景观的多个场景(总共1500个图像块)中采样图像块,这些场景包括农村地区、城市地区、密林、山区、水体、农业地区,覆盖整个加利福尼亚州。作为这项研究的一部分,开发了一种图像标记工具,用于手动标记属于特定土地覆盖类别的均匀图像块。标记后,从均匀图像块中提取28x28个不重叠的滑动窗口块,并用相应的标签保存到数据集中。我们选择28x28作为窗口大小,以保持一个明显更大的上下文,同时不使它像在上下文窗口中删除目标类条件分布的相对统计属性那样大。注意避免在选定和标记的图像修补程序中出现类间重叠。数据集被编码为MATLAB.mat文件,可以使用MATLAB中的标准加载命令读取。每个样本图像为28x28像素,由4个波段组成-红色、绿色、蓝色和近红外。训练和测试标签分别是SAT-4和SAT-6的1x4和1x6向量,分别具有从0到4或6和0个值在所有其他索引上的单个1索引。参考文献:Saikat Basu, Sangram Ganguly, Supratik Mukhopadhyay, Robert Dibiano, Manohar Karki and Ramakrishna Nemani, DeepSat - A Learning framework for Satellite Imagery, ACM SIGSPATIAL 2015.
- RSC11-11个场景,全部是从Google Earth下载的高分辨率遥感图像
- SIRI-WHU-该数据集包括12个类别,主要用于科研用途。以下各个类别中均包含200幅影像:农场、商业区、港口、闲置用地、工业区、草地、立交桥、停车场、池塘、居民区、河流、水体。每一幅影像大小为200*200,空间分辨率为2米。该数据集获取自谷歌地球,由武汉大学RS-IDEA研究组(SIRI-WHU)搜集制作,主要覆盖了中国的城市地区。参考文献:B. Zhao, Y. Zhong, G.-s. Xia, and L. Zhang, “Dirichlet-Derived Multiple Topic Scene Classification Model Fusing Heterogeneous Features for High Spatial Resolution Remote Sensing Imagery,” IEEE Transactions on Geoscience and Remote Sensing, vol. 54, no. 4, pp. 2108-2123, Apr. 2016.
- AID-AID是一个新的大型航空图像数据集,它从Google Earth图像中收集样本图像。尽管Google Earth图像是使用原始光学航空图像的RGB渲染进行后处理的,但事实证明,即使在像素级土地利用/覆盖图中,Google Earth图像与实际光学航空图像之间也没有显著差异。因此,Google Earth图像也可以用作评估场景分类算法的航空图像。新的数据集由以下30种空中场景类型组成:Airport, bare land, baseball field, beach, bridge, center, church, commercial, dense residential, desert, farmland, forest, industrial, meadow, medium residential, mountain, park, parking, playground, pond, port, railway station, resort, river, school, sparse residential, square, stadium, storage tanks and viaduct。所有的图像都由遥感图像解译领域的专家标记,图中显示了每一类的一些样本。AID数据集在30类中有10000个图像。参考文献:G.-S. Xia, J. Hu, F. Hu, B. Shi, X. Bai, Y. Zhong, L. Zhang, X. Lu, “AID: A benchmark dataset for performance evaluation of aerial scene classification”, IEEE Transactions on Geoscience and Remote Sensing, vol. 55, no. 7, pp. 3965-3981, 2017.
- NWPU-RESISC45-NWPU-RESISC45数据集是西北工业大学(NWPU)创建的一个公开的遥感图像场景分类数据集。该数据集包含31500幅图像,覆盖45个场景类,每个类700幅图像。这45个场景类别包括:airplane, airport, baseball diamond, basketball court, beach, bridge, chaparral, church, circular farmland, cloud, commercial area, dense residential, desert, forest, freeway, golf course, ground track field, harbor, industrial area, intersection, island, lake, meadow, medium residential, mobile home park, mountain, overpass, palace, parking lot, railway, railway station, rectangular farmland, river, roundabout, runway, seaice, ship, snowberg, sparse residential, stadium, storage tank, tennis court, terrace, thermal power station, and wetland. 参考文献:G. Cheng, J. Han, X. Lu. Remote Sensing Image Scene Classification: Benchmark and State of the Art. Proceedings of the IEEE.
- PatternNet-PatternNet是为遥感图像检索而收集的大规模高分辨率遥感数据集。共有38个类,每个类有800个大小为256×256像素的图像。PatternNet中的图像是从Google Earth图像或通过Google Map API为美国一些城市收集的。图中显示了每个类的一些示例图像。参考文献:Zhou, W., Shao, Z., Diao, C., & Cheng, Q. (2015). High-resolution remote-sensing imagery retrieval using sparse features by auto-encoder. Remote Sensing Letters, 6(10), 775-783.
- RSI-CB-考虑DCNN对图像大小的不同要求,分别构建了256×256和128×128像素大小的RSI-CB256和RSI-CB128两个空间分辨率为0.3-3m的数据集。前者包含35个类别和24000多幅图像。后者包含45个类别和36000多幅图像。根据国家土地利用分类标准和ImageNet分级机制,建立了严格的对象分类体系。这六类是农用地、建设用地和设施、交通运输和设施、水利设施、林地和其他用地。参考文献:Li H, Tao C, Wu Z, et al. RSI-CB: a large scale remote sensing image classification benchmark via crowdsource data[J]. arXiv preprint arXiv:1705.10450, 2017.
- AID++-参考文献:Jin P, Xia G S, Hu F, et al. AID++: An Updated Version of AID on Scene Classification[C]//IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium. IEEE, 2018: 4721-4724.
- RSD46-WHU-一个用于遥感图像场景分类的大尺度开放数据集。数据集是从Google Earth和Tianditu收集的。大多数类的地面分辨率为0.5米,其他类约为2米,每个类有500-3000幅图像。RSD46-WHU数据集有11.7万个图像,有46个类。参考文献:Y. Long, Y. Gong, Z. Xiao and Q. Liu, “Accurate Object Localization in Remote Sensing Images Based on Convolutional Neural Networks,” in IEEE Transactions on Geoscience and Remote Sensing, vol. 55, no. 5, pp. 2486-2498, May 2017. doi: 10.1109/TGRS.2016.2645610
- BigEarthNet-BigEarthNet是一个新的大型Sentinel-2标杆数据集,由590326个Sentinel-2图像块组成。为了建立BigEarthNet数据集,最初选择了在2017年6月至2018年5月期间在欧洲10个国家(奥地利、比利时、芬兰、爱尔兰、科索沃、立陶宛、卢森堡、葡萄牙、塞尔维亚、瑞士)获取的125张Sentinel-2图像。所有的图像块都是由Sentinel-2level 2A产品生成和格式化工具(sen2cor)进行大气校正的。然后,将它们分为590326个不重叠的图像块。每个图像块由2018年(CLC 2018)CORINE土地覆盖数据库提供的多个土地覆盖等级(即多个标签)进行注释。参考文献:G. Sumbul, M. Charfuelan, B. Demir, V. Markl, BigEarthNet: A large-scale benchmark archive for remote sensing image understanding, arXiv preprint, 2019.
语义分割
语义分割在自然数据集的分割效果不断进步,有研究逐步应用到了遥感领域,尤其是高分辨率遥感影像。由于遥感图像具有海量数据,尺度依赖,空间相关性强的特点,能够很好地语义分割的方法来提取地物或进行分类。随着全卷积神经网络的提出,卷积网络不仅在全图式的分类上有所提高,也在结构化输出的局部任务上取得了进步。全卷积神经网络实现了对图像进行像素级的分类,从而解决了语义级别的图像分割问题。 - Gaofen Image Dataset(GID)-Gaofen Image Dataset(GID)是一个用于土地利用和土地覆盖(LULC)分类的大型数据集.。它包含来自中国60多个不同城市的150张高质量高分2号(GF-2)图像,这些图像覆盖的地理区域超过了5万平方公里。GID图像具有较高的类内多样性和较低的类间可分离性。Gaofen-2(GF-2)是高清晰度地球观测系统(HDEOS)的第二颗卫星。GF-2卫星包括了空间分辨率为1m的全色图像和4m的多光谱图像,图像大小为6908*7300。多光谱提供了蓝色,绿色、红色和近红外波段的图像。自2014年启动以来,GF-2已被用于土地使用调查、环境监测、作物估算、建设规划等重要应用。参考文献:Tong X Y, Xia G S, Lu Q, et al. Learning Transferable Deep Models for Land-Use Classification with High-Resolution Remote Sensing Images[J]. arXiv preprint arXiv:1807.05713, 2018.
- ISPRS Test Project on Urban Classification and 3D Building Reconstruction—2D Semantic Labeling Contest-ISPRS提供了城市分类和三维建筑重建测试项目的两个最先进的机载图像数据集。该数据集采用了由高分辨率正交照片和相应的密集图像匹配技术产生的数字地表模型(DSM)。这两个数据集区域都涵盖了城市场景。Vaihingen是一个相对较小的村庄,有许多独立的建筑和小的多层建筑,Postdam是一个典型的历史城市,有着大的建筑群、狭窄的街道和密集的聚落结构。每个数据集已手动分类为六个最常见的土地覆盖类别。①不透水面 (RGB: 255, 255, 255);②建筑物(RGB: 0, 0, 255);③低矮植被 (RGB: 0, 255, 255);④树木 (RGB: 0, 255, 0);⑤汽车(RGB: 255, 255, 0);⑥背景 (RGB: 255, 0, 0);背景类包括水体和与其他东西不同的物体(例如容器、网球场、游泳池),这些物体通常属于城市场景中的不感兴趣的语义对象
- 2017 IEEE GRSS Data Fusion Contest-2017年IEEE GRSS数据融合竞赛采用分类作为主体。要执行的任务是对各种城市环境中的土地使用进行分类,更准确地说,是针对2012年地方气候区(LCZ)。竞赛选择了几个城市来测试LCZ预测在世界各地推广的能力。输入数据为多时相,多源和多模态,包括了图像和语义层。数据集为由四个部分组成。美国地质调查局提供的的地面卫星数据,包含8个多光谱波段即以100米分辨率重采样的可见、短和长红外波长;哨兵2图像:该图像空间分辨率为100米,拥有9个多光谱波段即可见光、近红外和短红外波长(包含修改的哥白尼数据2016);辅助数据:开放街道图(OSM)层,具有土地利用信息:建筑、自然、道路和其他土地利用区域。其中还为建筑和土地使用区域提供分辨率为20米的OSM层的栅格地图,可与卫星图像叠加。此外,对于选取的城市,还提供了城市几个地区的各种LCZ类的地面真实标签。标签为100米分辨率的栅格图像,也可叠加到卫星图像上。
- Aerial Image Segmentation Dataset-该航空图像分为数据集来自谷歌地图的航空遥感图像和来自OpenStreetMap的像素建筑、道路和背景标签。覆盖区域为柏林、芝加哥、巴黎、波茨坦和苏黎世。地物真实图像包括一张来自谷歌地图的东京地区航空图像,以及手动生成的、像素级的建筑、道路和背景标签。像素级标签以RGB顺序作为PNG图像提供,标记为建筑物、道路和背景的像素由RGB颜色[255,0,0]、[0,0,255]和[255,255,255]表示。
- 2018 IEEE GRSS Data Fusion Contest-数据是由NCALM于2017年2月16日在16:31至18:18 GMT之间从国家机载激光测绘中心获得的。在这场比赛中使用数据收集的传感器包括一个有三个不同波段的激光雷达传感器OPTech TITAM M(14sen/con340)、一个具有70毫米焦距的高分辨率的彩色成像仪Dimac ULTRALIGHT+,以及一个一个高光谱成像仪ITRES CASI 1500。多光谱激光雷达点云数据波段在1550nm,1064nm和532nm;从第一次返回每通道的栅格强度和DSM的空间分辨率为50cm。高光谱数据覆盖范围为380-1050nm,共有48个波段,空间分辨率为1m。高分辨率RGB遥感图像的空间分辨率为5cm,被分割成几个单独的图片。
- EvLab-SS Dataset-EvLab-SS数据集用于评估真实工程场景上的语义分割算法,旨在为遥感领域的高分辨率像素级分类任务寻找一种良好的深度学习架构。数据集来源于从中国地理条件调查和绘图项目,每幅图像都有地理条件调查的完整注释。数据集的平均大小约为4500*4500像素。EvLab-SS数据集包含11个大类,分别是背景、农田、花园、林地、草地、建筑、道路、构筑物、挖孔桩、沙漠和水域,目前包括由不同平台和传感器拍摄的60幅图像。该数据集包括35张卫星图像,其中19帧由World-View-2卫星采集,5幅由GeoEye卫星(采集,5帧由Quick Bird卫星采集,6帧由GF-2卫星采集。该数据集还有25幅航空图像,其中10幅图像的空间分辨率为0.25米,15幅图像的空间分辨率为0.1米。参考文献:Zhang M, Hu X, Zhao L, et al. Learning dual multi-scale manifold ranking for semantic segmentation of high-resolution images[J]. Remote Sensing, 2017, 9(5): 500.
- DeepGlobe Land Cover Classification Challenge-DeepGlobe Land Cover Classification Challenge是一个公共数据集,提供高分辨率亚米卫星图像,重点是农村地区。由于土地覆盖类型的多样性和注释的密度,该数据集比上面描述的现有对应数据集更具挑战性。该数据集共包含10146幅卫星图像,大小为20448*20448像素,分为训练/验证/测试集,每组图像为803/171/172张(对应70%/15%/15%)
- 38-Cloud dataset-该数据集包含38幅Landsat 8 场景图像及其手动提取的像素级地物真实标签,用于云检测。这些场景的整个图像被裁剪成多个384*384个斑块,以适合于基于深度学习的语义分割算法。数据集被划分为8400个斑块进行训练,9201个补丁进行测试。每幅图像有4个相应的波段,分别是红色(波段4)、绿色(波段3)、蓝色(波段2)和近红外(波段5)。参考文献:Mohajerani S, Krammer T A, Saeedi P. Cloud Detection Algorithm for Remote Sensing Images Using Fully Convolutional Neural Networks[J]. arXiv preprint arXiv:1810.05782, 2018.
- Aeroscapes-空中语义分割数据集包括使用商业无人机从5到50米高度范围内捕获的图像。该数据集为11个类提供了3269幅720p图像和地表真实标签。参考文献:Nigam I, Huang C, Ramanan D. Ensemble knowledge transfer for semantic segmentation[C]//2018 IEEE Winter Conference on Applications of Computer Vision (WACV). IEEE, 2018: 1499-1508.
- SEN12MS-SEN12MS是由180,748张相应的三种类型遥感数据组成的一个数据集,包括了Sentinel-1双极化SAR数据,Sentinel-2多光谱图像和MODIS土地覆盖图。其中Sentinel-1图像分辨率为20m,Sentinel-2多光谱图像分辨率为10m,波段数为13,MODIS的土地覆盖的图像分辨率为500m。
建筑物分割
建筑物是人类社会生产、生活的主要载体,建筑物轮廓信息是国家基础地理信息的重要组成部分。相比于人工遥感解译与矢量化,结合算法模型从遥感影像中自动提取建筑物轮廓大大减少了人力物力的消耗。这在城市扩张研究、数字城市建设等领域有着广泛的应用。近年来,全卷积神经网络的不断发展为高精度自动化建筑物提取提供了新的方法。但是,由于建筑物在尺度,建筑风格,形态上有较大差异,目前高精度建筑物提取仍存在较大挑战。一方面,难兼顾较好的建筑物定位精度(依赖于高层语义特征)与建筑物边缘精度(依赖于浅层特征)。另一方面,基于神经网络的方法往往依赖于大尺度数据集进行训练。 - Massachusetts-Massachusetts建筑数据集是一个用于建筑物分割的大型数据集。该数据集由151组航拍图像和相应的单通道标签图像组成,其中训练部分为137组,测试部分为10组,验证部分为4组。这些数据集中所有图像的大小为1500×1500,分辨率为1 米。每幅影像覆盖了2.25平方公里的区域,整个数据集大约覆盖340平方公里。建筑物标签由建筑物标签来自Open Street Maps。参考文献:Mnih V. Machine learning for aerial image labeling[D]. University of Toronto (Canada), 2013.
- SpaceNet Challenge-Spacenet数据集是2018年SpaceNet Challenge发布的数据集,该数据集包含了里约热内卢、维加斯、巴黎、上海、喀土穆、亚特兰大6个地区的高分辨率遥感影像及其对应的建筑物轮廓。其中,里约热内卢及亚特兰大采用的是DigitalGlobe的WorldView-2卫星上采集的30厘米图像,而维加斯、巴黎、上海、喀土穆则采用的是WorldView-3卫星上采集的30厘米图像。6个地区含有合计685,000栋建筑物。
- 航空影像目标识别数据集-对于航空图像分析过程的自动化需要大量训练数据用于机器学习算法的开发的需求,航空影像目标识别数据集提供了横跨9个美国城市的25个地点的高分辨率航空图像及40000多个建筑轮廓及地形高度数据(激光雷达)。除了建筑物轮廓,这个数据集还包含了道路矢量。建筑物和道路形状文件来自OpenStreetMaps(OSM);激光雷达数据来自美国国家海洋和大气管理局(NOAA)及德克萨斯州自然资源信息系统(TNRIS)。这个数据集适用于训练计算机视觉和机器学习算法,用于遥感影像目标识别和分割,特别是建筑物检测、道路提取及建筑物高度估计。参考文献:Bradbury, Kyle; Brigman, Benjamin; Collins, Leslie; Johnson, Timothy; Lin, Sebastian; Newell, Richard; et al. (2016): Aerial imagery object identification dataset for building and road detection, and building height estimation. figshare. Collection. https://doi.org/10.6084/m9.figshare.c.3290519.v1
- Inria-Inria数据集包含覆盖面积810平方公里(405平方公里用于训练,405平方公里用于测试的),空间分辨率为0.3m的航空正射彩色图像及影像对应的二值化建筑物轮廓。数据集只公开了训练集的建筑物标签,而测试集则只提供影像。这些影像覆盖了不同的城市聚落,从人口稠密的地区(如旧金山的金融区)到阿尔卑斯山区的城镇(如奥地利蒂罗尔的莱恩兹)。与传统的将相同图像的相邻部分分割为训练和测试子集不同,Inria数据集的训练集与测试集还分别包括了不同区域的影像,相同区域不同成像时间的影像。例如,芝加哥上空的图像包含在训练集中(不在测试集中),旧金山上空的图像包含在测试集中(不在训练集中)。这个数据集的最终目标是评估设计的模型的泛化能力:虽然相同地区的图像可用于训练,但该设计的模型应该在不同照明条件、城市景观和一年中的不同时间上,也能够实现精度较高的建筑物提取。参考文献:Maggiori E, Tarabalka Y, Charpiat G, et al. Can semantic labeling methods generalize to any city? The INRIA aerial image labeling benchmark[C]//IEEE International Symposium on Geoscience and Remote Sensing (IGARSS). 2017.
- USSOCOM 城市三维挑战数据集-基于卫星图像精确提取建筑物是制作精确三维模型和地图的首要和最具挑战性的步骤之一。虽然自动化算法不断改进,但仍需要大量的手动操作来确保地理空间的精度。基于此,USSOCOM 城市三位挑战旨在寻找一个机器学习算法,能够仅基于正射彩色卫星图像和三维高度数据提供可靠的建筑物自动标记。挑战公布了一个大规模的数据集,其中包括RGB影像,三维数字表面模型和三维数字高程模型,这些模型是由商业卫星图像生成的,覆盖了360多公里的区域,包含约157000个建筑物矢量。所有图像产品均以50厘米作为地面采样距离。参考文献:H. Goldberg, M. Brown, and S. Wang, A Benchmark for Building Footprint Classification Using Orthorectified RGB Imagery and Digital Surface Models from Commercial Satellites, 46th Annual IEEE Applied Imagery Pattern Recognition Workshop, Washington, D.C, 2017.
- DeepGlobe Challenge-2018年CVPR发布了DeepGlobe Challenge比赛,包括建筑物识别、道路提取及土地利用分类三个赛道。其中,建筑物识别及提取赛道发布了DeepGlobe Building Extraction数据集。数据集包括四个地区:拉斯维加斯、巴黎、上海和喀土穆。标记的数据集由240586幅200米×200米(对应650×650像素)的非重叠影像,及3020701栋建筑物轮廓组成。这些地区覆盖了不同的城市区域及乡村区域。影像来自WorldView-3传感器,具有31cm单波段全色影像及8波段1.24米多光谱图像。参考文献:Demir I, Koperski K, Lindenbaum D, et al. DeepGlobe 2018: A Challenge to Parse the Earth through Satellite Images[J]. arXiv preprint arXiv:1805.06561, 2018.
- CrowdAI Mapping Challenge-在CrowdAI Mapping挑战中,提供了RGB图像的卫星图像的各个分幅的数据集,以及它们对图像所在位置的相应建筑物轮廓。训练集是一套包含280741幅卫星图像(300x300像素RGB图像),以及它们在MS-COCO格式中的相应注释的数据集。测试集是一套包含60317幅卫星图像(300x300像素RGB图像)的数据集,以及MS-COCO格式的相应注释。测试集提供了60697幅卫星图像(300x300像素RGB图像),参赛者需要为测试集影像预测出建筑物标注并提交。
- WHU 建筑物数据集-WHU 建筑物数据集由航空数据集和卫星数据集组成。参考文献:Ji S, Wei S, Lu M. Fully Convolutional Networks for Multisource Building Extraction From an Open Aerial and Satellite Imagery Data Set[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018 (99): 1-13.
- AIRS-AIRS,航空图像屋顶分割数据集,是一个公开数据集,其目的是从非常高分辨率的航空图像中分割屋顶算法的基准。AIRS的主要特点可以概括为:覆盖范围457平方公里正射航空影像,总计超过22万栋建筑物。极高的图像空间分辨率(0.075m)。与屋顶轮廓严格对齐的屋顶轮廓标签。AIRS数据集几乎覆盖了新西兰南岛最大城市克赖斯特彻奇的全部地区。照片拍摄于2015年和2016年的飞行季节,所提供的图像是新西兰横轴墨卡托投影的RGB通道和7.5cm分辨率的正射校正DOMs。AIRS提出的分割任务包含两个类:屋顶像素和非屋顶像素。
- Open AI 坦桑尼亚建筑物数据集-Open AI坦桑尼亚邀请数据科学家开发特征检测算法,利用坦桑尼亚无人机飞行员通过桑给巴尔测绘计划(ZMI)收集的高分辨率航空图像,自动识别建筑物和建筑物类型。这项挑战的目标是在建筑的不同阶段对建筑足迹进行正确的分割和分类。Open AI 坦桑尼亚建筑物数据集以GeoTIFF文件和GeoJSON文件的形式提供,GeoJSON文件包含建筑物轮廓。geojson文件中的“condition”属性描述建筑的类别,属性中的任何其他字段都可以忽略。
变化检测
遥感图像变化检测指的是利用不同时期的遥感影像来获取某个区域内土地覆盖类型的动态变化信息,有助于自然资源管理部门及时掌握地类变化的态势和演化进程,为国土空间规划评估、预警以及维护更新提供坚实有力的参考,在土地资源管理、农林监测、自然灾害监测与评估等领域具有重要作用。近年来,深度学习方法被广泛应用于遥感图像智能解译方面,也为更快速更有效的变化检测提供了新的思路。 - Onera Satellite Change Detection (OSCD)-OSCD数据集由24对多光谱图像组成,分别为2015年和2018年由Sentinel-2卫星摄得,包含13个波段,并具有10m,20m和60m三种空间分辨率。其中的14对图像具有对应的像素级变化标记,可以用来训练和设置变化检测算法的参数。其余10对图像的变化标记尚未公开, 但可以将预测的变化结果上传至IEEE GRSS DASE网站进行评估,计算每一类的准确性和混淆矩阵,检验变化检测算法的有效性。参考文献:Urban Change Detection for Multispectral Earth Observation Using Convolutional Neural Networks R. Caye Daudt, B. Le Saux, A. Boulch, Y. Gousseau IEEE International Geoscience and Remote Sensing Symposium (IGARSS’2018) Valencia, Spain, July 2018
- Change Detection Benchmark in Aerial Imagery (AICD Dataset)-该数据集包含1000对800×600大小的图像及其对应的像素级变化标记,图像的地面分辨率约为0.5m。数据集包含100个不同的场景,包含树木、建筑物等对象。此外,为了分析视点差异对检测性能的影响,每个场景分别从五个不同的视点进行拍摄。下图展示了视点的设置,摄像机在高度约为250米,半径为100m的范围内,以10°为间隔,固定倾角约为-70度进行五个视点的拍摄。
- Urban Atlas-Urban Atlas数据集提供了主要欧盟城市范围内可对比的土地利用和土地覆盖数据,包含5份数据:(1) 2006年份319个地区的城市功能区数据“Urban Atlas 2006”; (2) 2012年份785个地区的城市功能区数据“Urban Atlas 2012”; (3) “Change 2006-2012”; (4) 部分区域的行道树图层“Street Tree Layer (STL)”; (5) 部分城市(欧盟28国和欧洲自由贸易联盟国家首都)的核心城区建筑高度数据“Building Height 2012”; 其中,“Urban Atlas 2006”和“Urban Atlas 2012”包含每个地区的城市功能区矢量图层及对应区域PDF格式的高分辨率地图,而变化图层“Change 2006-2012”统计了“Urban Atlas 2006”和“Urban Atlas 2012”中共同包含的区域的城市功能区变化情况。
LiDAR点云
如今,激光雷达技术(“光探测和测距”)在遥感界蓬勃发展。我们可以看到如今应用已经较为广泛,例如空中激光扫描(ALS),可用于大规模建筑测量、道路和森林;地面激光扫描(TLS),可用于室外和室内环境中更详细但速度较慢的城市测量;移动激光扫描(MLS)精度比TLS低,但由于传感器安装在在同一辆车上而具有更高的效率。 - Oakland 3-D点云数据集-Oakland 3-D数据是使用Navlab11和侧视的LMS激光扫描仪收集的。数据采集点位于宾夕法尼亚州匹兹堡奥克兰市的芝加哥大学校园。数据以ascii格式提供:x, y, z标签置信度,每行一点,空格作为分隔符。还提供了相应的vrml文件(.wrl)和标签计数文件(.stats)。数据集由两个子集(part2,part3)组成,每个子集有自己的本地参考帧,其中每个文件包含100000个三维点。对训练集/验证集和测试集进行了筛选,并将其从44个标签重新映射到5个标签中。参考文献:Daniel Munoz, J. Andrew (Drew) Bagnell, Nicolas Vandapel and Martial Hebert Conference Paper, Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), June, 2009
- Paris-rue-Madame-Paris-rue-Madame数据集包是由三维移动激光扫描仪收集得到。数据收集于法国巴黎第六区的一个街道rue Madame,试验区包含从rue Mézières至rue Vaugirard的160米长的街道;数据获取时间为2013年2于8日13:30。这个数据集是在TerraMobilita项目的框架下开发的。它是由位于法国普里斯帕里斯蒂奇矿山的机器人实验室(CAOR)的LARA2-3D三维激光扫描仪获得的。数据标注是由法国枫丹白露矿业中心(MINES ParisTech)的数学形态学中心(CMM)以人工辅助的方式进行的。数据集包含两个ply文件,每个ply文件包含有1000万个点。每个文件包含一个点列表(x, y, z, reflective, label, class),其中x, y, z对应于Lambert 93和altitude IGN1969(grid RAF09)参考坐标系中的地理参考坐标(E, N, U),reflective是激光强度,label是分割后获得的对象标签,class是对象类别。参考文献:A. Serna, B. Marcotegui, F. Goulette and J.-E. Deschaud “Paris-rue-Madame database: a 3D mobile laser scanner dataset for benchmarking urban detection, segmentation and classification methods”. ICPRAM 2014.
- IQmulus & TerraMobilita- IQmulus & TerraMobilita数据集是一个比赛数据集,数据包含由3亿个三维点组成的点云数据,数据于2013年1月在法国的一个城市密集区域获取。这个数据集是在iQmulus和TerraMobilita项目的框架下产生。它由法国国家测绘(IGN)开发的MLS系统Stereopolis II获取。数据标注由IGN的MATIS实验室以手动方式进行。在这个数据集中,数据存储为ply文件格式,整个三维点云被分割和分类,即每个点包含一个标签和一个类。因此,检测分割分类方法的逐点评价成为可能。参考文献:Bruno Vallet, Mathieu Brédif, Andrés Serna, Beatriz Marcotegui, Nicolas Paparoditis. TerraMobilita/IQmulus urban point cloud analysis benchmark. Computers and Graphics, Elsevier, 2015, Computers and Graphics, 49, pp.126-133. https://hal.archives-ouvertes.fr/hal-01167995v1
- District of Columbia-华盛顿的LiDAR点云数据可供任何人在Amazon S3上使用。该数据集由首席技术官办公室(OCTO)通过哥伦比亚特区地理信息系统计划管理,包含整个特区的平铺点云数据以及相关元数据。点云中的每个点都已根据以下模式进行了分类。
- semantic3d-semantic3d提供了一个带有大标签的自然场景的3D点云数据集,总计超过40亿点。它还涵盖了多种多样的城市场景:churches, streets, railroad tracks, squares, villages, soccer fields, castles等等。semantic3d提供的点云已使用最先进的设备进行静态扫描,并且包含非常精细的细节。参考文献:Hackel T, Savinov N, Ladicky L, et al. Semantic3d. net: A new large-scale point cloud classification benchmark[J]. arXiv preprint arXiv:1704.03847, 2017.
- Paris-Lille-3D-Paris-Lille-3D是点云分类的基准。数据是由法国两个不同城市(巴黎和里尔)的移动激光系统(MLS)产生的。点云已完全被手工标记为50种不同的类别,以帮助研究社区进行自动点云分割和分类算法。参考文献:Roynard X, Deschaud J E, Goulette F. Paris-Lille-3D: A Point Cloud Dataset for Urban Scene Segmentation and Classification[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops. 2018: 2027-2030.
- DublinCity-DublinCity数据集是都柏林大学学院(UCD)的城市建模小组通过ALS设备扫描都柏林市中心的主要区域(大约5.6平方公里)。在总共的14亿个点云中包含大约2.6亿个标记点标记(图1)。标记区域位于点云的最密集采样部分内,并且被航空影像完全覆盖。参考文献:S M Iman Zolanvari, Susana Ruano, Aakanksha Rana, Alan Cummins, Rogerio Eduardo da Silva, Morteza Rahbar, Aljosa Smolic. 2019 DublinCity: Annotated LiDAR Point Cloud and its Applications. 30th BMVC, September 2019.
高光谱遥感
高光谱遥感是将成像技术和光谱技术相结合的多维信息获取技术,可以同时获取目标的二维空间信息与第三维的光谱信息,得到高光谱分辨率的连续、窄波段图像数据。高光谱图像与高分辨率图像、多光谱图像相比的优势在于,它的光谱分辨率高,波段众多,能够获取地物几乎连续的光谱特征曲线,并可以根据需要选择或提取特定波段来突出目标特征;定量化的连续光谱曲线数据为地物光谱机理模型引入图像分类提供了条件;它包含丰富的辐射、空间和光谱信息,是多种信息的综合载体。高光谱图像在地物制图、资源勘探等领域得到了广泛使用。 - Washington DC数据-WashingtonDC数据是由Hydice传感器获取的一幅航空高光谱影像,数据包含了从 0.4 到2.4 ?m可见光和近红外波段范围的共191个波段,数据大小为1208*307。地物类别包括屋顶,街道,铺碎石的路,草地,树木,水和阴影。
- Urban数据-Urban数据通常被用于高光谱图像混合像元分解。它是由Hydice传感器获取的,图像大小为307*307。原始数据有210个波段,在去除噪音和水吸收波段后,一般留下162个波段做后续处理与分析。地物类别包含道路,屋顶,草地和树木。
- Pavia University和 Pavia Center数据-Pavia University 和 Pavia Center 数据是由ROSIS传感器获取的,常被用于高光谱图像分类。传感器一共有115个波段,经过处理后,Pavia University数据有103个波段;Pavia Center 数据有102个波段。两幅影像都有9个地物类别,这两幅影像的类别不完全一致。其中,Pavia University的大小为610×340,Pavia Center的大小是1096*715,详细信息如下图所示。
- Houston数据-(需申请使用)Houston数据是由ITRES CASI-1500传感器获取的,由2013 IEEE GRSS数据融合大赛提供。数据大小为349*1905,包含光谱范围从364nm到1046nm的144个波段。地物覆盖被标注为如下图所示的15个类别。
- Eagle_reize-Eagle_reize数据是由SPECIM AsiaEAGLE II传感器获取的。数据大小为2082*1606,包含光谱范围从401nm到999nm的252个波段。所提供的训练样本包含10种地物类别。因为此数据有配套的Lidar数据,因此既可以被用于单独的高光谱图像分类,也可以被用于高光谱图像和Lidar图像融合。
- BerlinUrbGrad2009-Berlin-Urban-Gradient dataset 2009数据包含不同分辨率的HyMap高光谱影像和模拟的EnMap高光谱影像。真实的MyMap数据包含111个波段,其中空间分辨率为3.6m的数据大小为68951803,空间分辨率为9m的数据大小为2722732。此数据集不仅提供了分类参考,也提供了端元参考,因此可以用来做高光谱图像分类或者高光谱图像混合像元分解。
- HyRANK-HyRANK数据是由Hyperion 传感器获取的。包含了两幅用于训练的高光谱图像和三幅用于测试的高光谱图像。五幅图像均有176个光谱波段,图像大小各不相同。所提供的训练样本包含14种地物类别。
- Indian Pine-Indian Pine 是由 AVIRIS 传感器在印第安纳州拍摄的。这个数据的大小是145*145,有224个波段,其中有效波段200个。这个数据一共有16个农作物类别。
- Salinas Valley-由 AVIRIS 传感器拍摄,拍摄地点是加州 Salinas Valley。这个数据的空间分辨率是3.7米,大小是512*217。原始数据是224个波段,去除水汽吸收严重的波段后,还剩下204个波段。这个数据包含了16个农作物类别。
- DFC2018 Houston-2018年IEEE GRSS Data Fusion 比赛所用的数据集。这个数据是由 University of Houston Dr. Saurabh Prasad 的实验室制作公开的。这个数据是个多传感器数据,包含了48个波段的高光谱数据(1米),3波段的LiDAR数据(0.5米),以及超高分辨率影像(0.05米)。这个数据包含了20类地物。使用这个数据前请联系 Dr. Saurabh Prasad.
- 航空高光谱影像 Chikusei-这个航空高光谱数据是由Headwall Hyperspec-VNIR-C传感器于日本筑西市(Chikusei)拍摄的,拍摄时间是2014年7月29日。这个数据包含了128个波段,范围是343 – 1018 纳米,大小是2517*2335,空间分辨率是2.5米。一共有19类地物,包含了城市与农村地区。这个数据是由东京大学 Dr. Naoto Yokoya 与 Prof. Akira Iwasaki 制作公开的。参考文献:N. Yokoya and A. Iwasaki, “Airborne hyperspectral data over Chikusei,” Space Appl. Lab., Univ. Tokyo, Japan, Tech. Rep. SAL-2016-05-27, May 2016.
- KSC-由 AVIRIS 传感器在佛罗里达州肯尼迪太空中心于1996年3月23日拍摄。这个数据包含了224个波段,经过水汽噪声去除后还剩下176个波段,空间分辨率是18米,一共有13个类别。
图像融合
遥感图像时空融合,指的是结合高空间,低时间分辨率图像(如Landsat,SPOT等,以下简称为细图像)和低空间,高时间分辨率图像(如MODIS等,以下简称为粗图像),生成同时兼具高空间,高时间分辨率的合成遥感数据。这样的数据对于植被监测,环境监测,农作物估产等应用有很大的帮助。“遥感图像时空融合”这个概念自2006年被提出,至今已经发展了十多年。 - AHB,Tianjin和Daxing数据集-中山大学李军教授团队提供的三个Landsat-MODIS数据集,分别来自内蒙古阿鲁科尔沁旗(Ar Horqin Banner),天津和北京大兴区,参考文献:J Li, Y Li, L He, J Chen and A. Plaza. Spatio-Temporal Fusion for Remote Sensing Data: An overview and New Benchmark. Sci China Inf Sci, accepted for publication, 2020.
气候/气象
全球
- Windy-比较专业的商业气象应用,提供API接口获取数据
- National Climatic Data Center - NOAA-美国国家环境信息中心,监测,评估和提供国家气候和历史天气数据和信息
- ClimateData.Us -美国宇航局公布的美国气候数据
- WorldClim V2-
- WorldClim 气候情景数据-
- NCAR GIS Climate Change Scenarios-Lots of data from the National Centre for Atmospheric Research models, including data used by the IPCC in their reports.
- CRU Climate Datasets-Various datasets including temperature, precipitation, pressure, drought, paleoclimate and others, from the (infamous) Climate Research Unit at the University of East Anglia. High and low resolution datasets available.
- Downscaled GCM Portal-A wide range of downscaled (that is, higher resolution data) created from the outputs of a wide range of GCMs. Covers the majority of important climate variables.
- Global Potential Evapotranspiration and Aridity Index-Potential Evapotranspiration data and indices of aridity at 30 arc-second resolution in raster format.
- GlobAerosol-Aerosol data in raster format (provided as NetCDF files), including estimations of AOD at 550nm and the Angstrom coefficient.
- Global Aerosol Climatology Project-Monthly averages of Aerosol Optical Thickness and the Angstrom exponent from 1981 to 2006.
- Satellite Application Facility on Climate Monitoring-Provides near real-time and retroactively-generated datasets of cloud cover, type and temperature, surface radiation budget and temperatures, amongst others.
- Climate Analysis Indicators Tool-Carbon Dioxide emissions data by country, and by US state, including measures of adaption.
- International Satellite Cloud Climatology Project-Monthly averages of a number of cloud variables including cloud cover (and associated breakdown by frequency), cloud top temperature, cloud water path, cloud optical thickness etc.
- Climatological Database for the world’s oceans (CLIWOC)-Data compiled from ships logs compiled during voyages between 1750 and 1850. Includes various meteorological observations, broken down by date, ship and year.
- IRI/LDEO Climate Data Library-A wide range of over 300 datasets from various climate models and datasets.
- World Ozone and Ultraviolet Radiation Data Center-Extensive set of data collected from many stations across the world, recording ozone information (from ozonesonde ascents) and ground-level ultraviolet irradiance.
- -
地区
- European Climate Assessment and Dataset-Gridded observation data across Europe, including cloudiness, temperature, precipitation, humidity, pressure, snow and sunshine.
- Gridded climatic data for North America, South America and Europe-A huge range of climatic data at 1km and 4km resolution, derived from various models, including temperature, precipitation, snow and derived variables such as water deficit and continentality.
美国
- NREL Wind-Wind availablity data across the US from the perspective of wind turbine generation.
- National Solar Radiation Database-Over thirty years of solar radiation data from sites across the US, Guam and Puerto Rico, plus raster data at around 2km resolution.
- Iowa Environmental Mesonet-A range of up-to-date and historic weather data including storm reports, NWS warnings, climate reports and more. Not just for Iowa!
环境
中国
- 中国生态环境部-
- 生态环境部数据中心-
全球
- Atlas of the Biosphere-威斯康辛大学尼尔森实验室提供的环境数据,Raster maps of environmental variables including soil pH, potential evapotranspiration, average snow depth and many more.
- World Spatial Database of Protected Areas-全球环境保护区数据,中国部分的数据不全,Global vector database of marine and terrestrial protected areas. Rather complicated to download from - instructions at bottom of linked page.
- IUCN 2013 Red List-Set of shapefiles produced by the IUCN showing the distribution of endangered species of plants and animals across the world
- Protected Planet-Map of protected areas across the whole world, of almost all types. Available for download by clicking the ‘Download All’ link on the homepage, and then scrolling to the bottom and choosing KMZ, SHP or CSV.
美国
- EPA Environmental Dataset Gateway-Catalog giving access to all environmental data from the Environmental Protection Agency.
- National Wetlands Inventory-Wetland extent and type across the US, including information on riparian vegetation.
- Protected Areas Database of the US-Shapefile of all protected areas in the US including attribute data description uses, reasons for protection and legal status.
- Web Soil Survey-Downloadable soil data for the US in both tabular (csv) and geospatial (shp) formats.
欧洲
- European Environment Agency-Maps and datasets from the European Environment Agency, covering a huge range of physical geography and environmental topics. Europe only.
- -
卫生/健康
中国
地方
全球/其他地区
- 2019-nCoV-2019新冠肺炎疫情数据
- A Deep Catalog Of Human Genetic Variation-国际基因组样本资源
- GHDx-健康指标和评估研究所 - 来自世界各地的健康和人口统计数据集目录,包括IHME结果
- UNICEF Statistics And Monitoring-联合国儿童基金会官网,开放世界各国家、地区的儿童状况报告
- -
自然资源
土地资源
全球
USGS Land Cover Institute-Great set of links to almost all land cover datasets. Links here include most of the datasets below, and many more esoteric data such as river observations, aquifers data and ocean colour information. Although the page starts with US data, it continues with data for other continents lower down the page
Corine Land Cover Map-Europe only. Satellite derived land cover, available as at 1990, 2000 and 2006 in vector and raster formats. 100m and 250m resolutions.
GLOBCOVER-Global land cover dataset at 300m resolution from the MERIS sensor on the ENVISAT satellite.
Climate Change Initiative Land Cover map-Global land cover dataset at 300m resolution, for 1998-2002, 2003-2007, 2008-2012. In many ways the ‘successor’ to GLOBCOVER.
MODIS Global Land Cover-1km and 4km resolution global land cover maps derived from MODIS images.
UMD GLC-1km resolution global land cover maps from the University of Maryland created using a classification tree approach from MODIS data
EarthEnv Global Consensus Land Cover-1km-resolution global land cover, produced by integrating many other land cover datasets, and providing information on the consensus (or lack of consensus) between them
Global Land Cover by National Mapping Organisations-1km data of land cover for the globe, with a classification scheme based on the UN FAO LCCS, facilitating easy comparison with other land cover products.
GLC-SHARE-Global Land Cover data combined from ‘best available’ national land cover maps. 1km resolution.
Vegetation Map at Last Glacial Maximum-Broad-scale map of the world showing vegetation cover at the Last Glacial Maximum (25,000 - 15,000 BP)
Grassland GIS-Grassland extent data, along with grassland usage (eg. livestock intensity per area of grassland)
Global Lakes and Wetlands Database-Global vector datasets showing areas of lakes, reservoirs, wetlands, swamps, bogs etc.
Forest GIS-Percentage tree-cover, population density and tree cover, share of wood in fuel consumption etc.
PALSAR Forest/Non-Forest map-A very detailed (50m resolution) forest map for the whole globe, created from SAR data.
Global Forest Change 2000-2014-Loss and gain in tree cover between 2000 and 2014, globally, at 30m resolution.
Global Land Use Dataset-Gridded data at 0.5 degree resolution showing population density, potential natural vegetation, cropland extent, (This contents are copy from ealen), grazing land extent, built-up land extent, crop extent (for 18 major crops) and land suitability for cultivation
Human Influence and Footprint-人类足迹,Human Influence Index and Human Footprint calculated from various factors which exert human influence on ecosystems, for example population distribution, urban areas, navigable rivers etc. Available at 30 arc-second resolution.
Global Agricultural Lands-Extent and intensity of use of agricultural lands (both cropland and pasture) in 2000 from MODIS and SPOT images and agricultural inventory data.
Global Irrigated Area and Rainfed Crops Areas-Vector mapping of global irrigated cropland and rainfed cropland.
Crop Calendar GIS-Gridded data on planting dates and harvesting dates across the world for 19 crops. Available at 5 minute and 0.5 degree resolutions.
EarthStat: Agricultural Land Use and potential use-A number of GIS datasets on agricultural land use, including global cropland and pasture from 1700 to 2007, harvested areas and yields for 175 crops, and global fertiliser application rates.
ESPON Urban Morphological Data-Data on urban areas for Europe including many attributes.
European Urban Morphological Zones-Data derived from the CORINE landcover dataset showing all sets of urban areas lying less than 200m apart.
Global Human Settlement Layer-Multi-temporal data on built-up areas, including population, settlements and degree of urbanisation.
Global Urban Footprint-Global map of built-up areas at 12m resolution.
Seto数据-Seto数据
中山大学数据-中山大学数据
地区
- Corine Land Cover Map-Europe only. Satellite derived land cover, available as at 1990, 2000 and 2006 in vector and raster formats. 100m and 250m resolutions.
美国
- National Land Cover Database 2001 and 2006-NLCD data for download at 30m resolution. Data includes raw land cover information (in 16 classes) and data on changes between 2001 and 2006.
- Phenology-Seasonal changes in vegetation across the US from remote sensing images. Various datasets including Start of Season Time, Time of Maximum, Amplitude and Time-Integrated NDVI.
- MODIS Irrigated Agriculture dataset-Raster irrigated area maps for the US, derived from MODIS data and available at 250m and 1km resolutions.
- USGS Land Cover Trends-Land Cover Trends from approximately 1970 until 2000 at approximately 30m resolution.
- Pacific Coast Land Cover-Land Cover from 1996, 2001 and 2006 derived from Landsat images for the Pacific Coast of the USA (California, Oregon and Washington). 30m resolution.
- Chesapeake Bay Land Cover-Land cover for the Chesapeake Bay Watershed for 1984, 1992, 2001 and 2006.
- Coastal Change Analysis Program-Nationally standardised database of land cover and land cover change information for the coastal areas of the US. Available in various raster formats.
- CropScape-Crop-specific land-cover data for the continental US. Includes historic data back to 1997.
- -
水资源
水文
全球
- HydroSHEDS-Hydrological data and maps based on the STRM elevation data. Includes river networks, watershed boundaries, drainage directions and flow accumulations for the globe.
- Catchment Characterisation and Modelling-Data on river basins, catchments and rivers for the European Union area.
- Major Watersheds of the World Deliniation-全球流域划分矢量数据,Vector data showing the outlines of major watersheds (river basins) across the world.
- Water Isotopes-Global grids of hydrogen and oxygen isotope composition of precipitation and environmental waters in ArcGRID format. Data can be downloaded for whole globe or individual continents.
- JRC Water Portal-European water data from the EC Joint Research Centre, including data on quantity, quality, price, use, exploitation and irrigation.
- General Bathymetric Chart of the Oceans-A range of gridded bathymetric datasets compiled by a group of experts.
- EarthEnv Freshwater Ecosystems Environmental Information-1km-resolution environmental information for freshwater ecosystems, covering almost the whole globe. Information includes climate, land-cover, soil and geology.
- Global River Widths from Landsat (GRWL)-Dataset containing information on widths of rivers (max, min, mean, median for each segment of river) across the world, derived from Landsat data.
- Coastal Water Quality-Quality of coastal waters across the globe measured by chlorophyll concentrations from SeaWIFS satellite. Data for 1998 and 2007.
- Global Reservoir and Dam Database-Geographically-referenced data on all reservoirs with a storage capacity of more than 0.1 cubic kilometres. The data consists of polygons outlining reservoirs at high spatial resolution with extensive metadata about the dam and reservoir.
美国
- National Hydrography Dataset-Geodatabases of hydrological information for the US, including lakes, ponds, streams, rivers, dams and streamgauges. Topologically-correct network is available allowing for flow modelling.
- National Water Quality Assessment Data Warehouse-Huge amounts of georeferenced data (although not always provided as GIS-ready files) about water quality, including groundwater and surfacewater sampling, discharges and health information.
- North American River Width Data Set (NARWidth)-Width measurements of rivers in North America, at approximately mean discharge, from satellite data. Provided as vector points, with a range of useful attributes.
- Multibeam Bathymetry for the Lower Mississippi River-Data from the US Corps of Engineers, collected in 2013. Data from 2010 is also available.
冰川冰盖/积雪
- Randolph Glacier Inventory-A global inventory of glacier outlines, including some multi-temporal data. Major focus on quality control.
- NSIDC Frozen Ground maps-Maps of various types of frozen ground (permafrost) in the Arctic and various other areas. Data can be downloaded by clicking on the map name then selecting ‘Access Data’
- Multisensor Analyzed Sea Ice Extent (MAISE)-Sea ice extent for the Northern Hemisphere from the NSIDC
- Snow Data Assimilation System-美国地区积雪数据,Gridded data at 30 arc-seconds, from September 2003 till present, including snow depth, snow water equivalent, solid precipitation, liquid precipitation and more. Contiguous US only.
能源/矿产
- OneGeology Portal-Combined geological maps from many geological organisations across the world. Levels of detail vary across the world, but basic data is available for many areas, with more detail for certain countries.
- Mineral Resources Data System-Vector data of mineral resources across the world including names, locations, descriptions, geological characteristics etc.
- Volcanogenic Massive Sulphide deposits-Information on VMS deposits from across the world with attribute data.
- North Sea Oil Offshore Maps and GIS - English sector-Maps from the UK government showing licensing information, locations of wells and country-ownership boundaries.
- North Sea Oil Offshore Maps and GIS - Dutch sector-Same as above but for the Dutch-controlled area of the North Sea. To download data click the links under ‘Download’ on the right-hand side
- North Sea Oil Offshore Maps and GIS - Netherland sector-Same as above but for Netherland-controlled area of the North Sea.
- Nuclear Power Station locations-全球核电站位置(链接失效),Locations of all nuclear power stations worldwide (according to the IAEA), provided as a Google Fusion Table. Export to CSV for easy import to a GIS system
美国
- US National Power Grid-Data from FEMA (the Federal Emergency Management Agency) showing rough locations of transmission lines and their connectivities. Data from 1993 and has not been updated since.
- Emissions & Generation Resource Integrated Database-A comprehensive data source on the environmental characteristics (air emissions, resource mix, net generation and more) of all electrical power sources in USA. Each record contains location information, allowing use in GIS.
- US Energy Information Administration-Individual layers from their interactive mapping system, including coal mines, crude oil pipelines, petrochemical crackers, refineries and more.
生物/生态
- 生物多样性数据-生物多样性数据
- MoveBank-动物轨迹
- 中国植物图库-
- 中国野鸟图库-
- 中国海洋鱼类原色图库-
- 菜鸟网-鸟类、蝴蝶类
- 上海野鸟会论坛-
- 昆虫Biodiversity Data Journal-
- Lifemapper-物种分布数据,Species distribution maps - both recorded and predicted (based on climate, terrain and land cover This contents are copy from ealen). Covers a huge number of species. *Data is available by clicking on Species Archive, searching for a species and then clicking on the number of points and choosing the SHP link at the top. Alternatively, web services are available.
- WWF World Ecoregions-Shapefile of ecoregions as defined by the WWF Conservation Science Program.
- Ecoregions 2017-世界陆地生态区划分的可视化应用,a new map and a major update of the 2001 WWF Terrestrial Ecoregions of the World, depicting 846 ecoregions that represent our living planet. The shapefile can be downloaded under the ‘About’ link.
- 2001 WWF Terrestrial Ecoregions-2001世界陆地生态区划分
- Anthropogenic Biomes-Ecosystem unit maps derived from human interactions with ecosystems creating ‘anthropogenic biomes’. Gridded data at 5 arc-seconds available.
- Amphibian Species Distribution Grids-Approximately 1km resolution gridded data showing species distribution. One file per species.
- Net Primary Productivity-Gridded Net Primary Productivity data across the globe, including a novel measure of ‘Human Appropriation of NPP’ measuring how much of the NPP of an area humans are using.
- World Soil Information-Gridded datasets covering the world’s soils at a maximum resolution of 5 arc-minutes with 22 attributes for each cell including organic carbon content, gypsum content, water capacity etc. Data is given for topsoil and subsoil. More detailed datasets for individual countries and continents are available.
- Harmonized World Soil Database-Combining regional and national soil databases and maps from many countries under the Land Use Change programme of the UN FAO. Includes soil units and parameters (such as pH, depth, and texture) and is at a resolution of 30 arc-seconds.
- ERS/MetOp Soil Moisture-25-50km resolution soil moisture data from satellite scatterometer measurements.
- Global High Resolution Soil Water Balance-Raster data containing actual evapotranspiration and soil water deficit with a resolution of 30 arcseconds (approx 1km).
- Global Carbon Storage in Soils-Gridded carbon storage in soils for the world, from the World Resources Institute.
- ReefBase-全球珊瑚礁数据,GIS data about coral reefs worldwide, including extensive attribute data.
- Human Impacts to Marine Ecosystems-Data from the National Center for Ecological Analysis and Synthesis on human impacts to marine ecosystems. Includes fishing impacts, ocean acidification, sea surface temperature, pollutants and more.
- Carbon Dioxide Information Analysis Center-All data products from this center are available for download, including atmospheric CO2 concentrations (including the famous Mauna Loa dataset), precipitation data, long-term modelling data and more.
- UNEP WCMC-Variety of datasets from the United Nations Environment Programme including global wetlands, global distribution of coral reefs, mangrove distributions and more.
- Aquamaps-Standardised distribution maps for over 11,000 species of fish, marine mammals and invertebrates. *Data available for download under High Resolution Maps and Environmental Data links.
- Terrestrial Ecoregions of the World-Vector data showing a biogeographic classification of terrestrial ecological regions across the world.
- Freshwater Ecoregions of the World-Vector data showing a biogeographic classification of freshwater ecological regions across the world.
- Marine Ecoregions of the World-Vector data showing a biogeographic classification of marine ecological regions across the world.
- BioFRESH-Contemporary distributions of freshwater species, mapped in vector format across the world
- Global Habitat Heterogeneity-A set of 14 metrics on the spatial heterogeneity of global habitat, at 1km, 5km and 25km resolutions, derived from MODIS EVI data.
- The Nature Conservancy - Geospatial Conservation Atlas-Various interactive maps and downloads of conservation data, including Freshwater Ecoregions of the World, Coral Reefs, Mangroves and more.
美国
- Terrestrial Ecosystems of the United States-A mid-scale ecological classification consisting of over 800 ecosystem types found across North America.
- Digital Species Distribution Maps-Data showing distribution of a range of types of species (pollinators, birds, mammals etc.) across the USA. Downloadable as one, or split into species.
- Bird and Mammal Species Distribution Grids-Raster grids showing species distribution across the US of birds and mammals. One grid per species, approximately 1km resolution.
- Ecological Land Cover Map-The most complete map ever produced of vegetative associations for the US. Land cover is classified in to 551 Ecological Systems and 32 Modified Ecological Systems (areas where human impacts have affected the ecology). Available for download as ARC GRID or ERDAS IMAGE
- US Fish and Wildlife Service National GIS datasets-Information and boundaries for Coastal Barrier Resource Systems, Critical Habitats, Ecosystem Regions, National Wetlands, National Wildlife Refuge Systems etc.
- Gulf Coastal Plains and Ozarks LCC-Range of datasets provided through the conservation planning atlas for this area. Includes boundaries, ecological information, marine resources and more.
自然灾害
- Natural Disaster Hazards-Hazard Frequency, Mortality and Economic Loss Risk as gridded data for the globe. Covers cyclones, drought, earthquakes, flood, landslide, volcano and a combination of them all (‘multihazard’).
- USGS Earthquakes Database-美国地质调查局提供的地震数据,KML files of all earthquakes recorded by the USGS (across the whole world) from 1973 to present. Available as one dataset or grouped by magnitude or year.
- Global Seismic Hazard Map-Gridded data showing hazard risk of seismic activity across the globe.
- IBTrACS-飓风/台风,Hurricane and tropical cyclone tracks, including attributes such as minimum pressure, maximum winds.
- NOAA/WDC Historical Tsunami Database-海啸,Location information of tsunami sources and run-up events, including many attributes (eg. maximum water height, travel time). Available in TSV format which can be imported into GIS systems.
- MODIS Fire Detection Data-基于MODIS遥感数据的火点监测,Frequently updated data (including last 7 days of fires) in 1km grid format, derived from thermal anomalies from MODIS data.
- Lightning and Atmospheric Electricity Dataset-闪电/雷电,Wide range of data on lightning activity, including average flashes per grid cell per year.
- NOAA Historical Hurricane Tracks-飓风/台风,北美地区的数据,Hurricane tracks for all North/Central American hurricanes. Data can be exported by clicking the Download button on the top right.
- Natural Disaster Hotspots-A wide range of geographic data on natural disasters (including volcanoes, earthquakes, landslide, flood and ‘multihazards’) with hazard frequency, economic loss etc.
人文地理
综合类
- UNEP GEOdata-A wide range of data from the United Nations Environment Programme including Nighttime Lights, Pollutant Emissions, Commercial Shipping Activity, Protected Areas and Administrative Boundaries. To get data, choose Advanced Search and select Geospatial Data Sets from the top drop-down link
- World Bank Geodata-世行地理数据,A wide range of World Bank datasets converted to KML format, includes GNP, schooling and financial data.
- Humanitarian Response Common and Fundamental Operational Datasets Registry-List of freely available datasets for many countries run by the UN Humanitarian Response programme. Contains administrative boundaries, transport, population and more. Fairly empty at the moment but due to be updated soon
- Atlas of the Biosphere-Gridded human data including per capita oil usage, literacy rate, population growth rate, built-up land and many more.
- Koordinates-GIS data aggregation site including data in a number of categories such as administrative boundaries, transportation etc. Some global datasets, some based on continents, some for specific countries. Mostly vector, but some raster.
- GISTPortal-Wide range of GIS data from a project funded by UNAID to provide spatial data for humanitarian purposes.
- ESPON Grid Data-Various human geography indicators in gridded raster form across Europe, including GDP, population and unemployment in 2003 and 2006.
- History Database of the Global Environment-Gridded time-series of population, land-use for the last 12,000 years. Also includes GDP, agriculatural areas, yields and greenhous gas emissions for the last century.
- National Historical GIS-美国历史的GIS数据,Historical GIS data for the USA, including demographics, ancestry, education and more.
- G-Econ-Geographically-based economic data, basically providing measurements like GDP but on a raster cell basis (known as Gross Cell Product).
- GAR15-UN dataset for Global Assessment of Risk, showing the amount of capital invested in infrastructure at a 5km resolution. Useful for assessment of infrastructure risk and cost of natural disasters.
- Internet Map-全球互联网接入地图,Data which can be used to produce maps like those shown here showing major linkages in the internet, as well as density of people online
战争/冲突/犯罪
- ACLED-Armed Conflict Location and Event Data - containing all reported conflict events in 50 countries in the developing world. Data from 1997 to present, and in Afghanistan and Pakistan from 2006 until present.
- Uppsala Conflict Data Programme - Georeferenced Event Database-Locations of instances of political violence in Africa and Asia.
- Global Terrorism Database-A database of terrorist events (both domestic and international) across the world from 1970-2008, including location and attribute information.
- Peace Research Institute Oslo-A range of data including armed conflict locations, replication data, arms trade flows and resource datasets.
- National Archive of Criminal Justice Data-Crime data from the US, including various statistics - all geo-referneced but not necessarily provided in GIS-ready formats.
人口
- Gridded Population of the World-Includes raw population, population density, both historic, current and predicted.
- WorldPop-High-resolution, contemporary data on population across Africa, Asia and Central/Southern America. Combines the AfriPop, AmeriPop and AsiaPop projects.
- High Resolution Settlement Layer-Estimates of human population at approximately 30m resolution, for 2015.
- GeoHive-Population and country statistics. Not provided in GIS data formats, but can easily be converted from CSV
城市
中国
全球/其他地区
- Large Urban Areas 1950-2050-Historic, current and future estimates of populations in large urban areas of the world.
- Global Rural-Urban Mapping Project-Based on the above, but includes information on rural and urban population balances.
- Global Urban Extent-Maps showing urban extent across the world, at 500m resolution, derived from MODIS images.
- POI Factory-Point of Interest files originally designed for use in GPS units, but they can be loaded into a GIS fairly easily. Widely varying quality, and coverage, but includes such things as shop and business locations (eg. all Tesco stores, all McDonald’s restaurants) as well as places of worship, speed cameras etc. Registration is required. To download data in a GIS-ready form choose Garmin CSV format on the download page. The CSV file will contain Latitude and Longitude in WGS-84 co-ordinates, as well as descriptions.
- SimpleGeo’s Places-Point of Interest data from SimpleGeo, provided as a 2Gb Zip file and licensed under the Creative Commons license. Contains over 21 million POIs for over 63 countries.
- Zillow data-美国社区行政边界和房地产数据,Creative-commons licensed data from Zillow showing the extent of neighbourhoods in urban areas.
- -
交通
全球
- OpenStreetMap-OpenStreetMap is a free worldwide map, created by people users. The geo and map data is available for download.
- OSM Metro Extracts-City-sized extracts of the OpenStreetMap dataset, updated weekly for cities across the world
- Open Flights-Airport, airline and route data across the globe. Data is provided as CSV files which can be easily processed to produce GIS outputs. Data includes all known airports, and a large number of routes betwen airports.
- World Port Index-Dataset from the National Geospatial Intelligence Agency listing approximately 3700 ports across the world, with location and facilities offered.
- Global Roads Open Access Data Set-A vector dataset of roads across the world, using a globally consistent data model, and suitable for mapping at the 1:250,000 level. Only roads between settlements are included, not residential streets, and the dataset is accurate to approximately 50m. This dataset is in beta-testing at the moment and will be fully available shortly
- JRC Travel Time to Major Cities-Travel time to the nearest major city (> 50,000 people) across the whole world, at approximately 1km resolution
- MAP Accessibility to Cities-Similar dataset to the previous one, but updated with far more roads and far better treatment of unpaved roads. Data available for download or on Google Earth Engine.
- Undersea Telecommunications Cables-Open source undersea telecommunication cables map, updated frequently. Data can be visualised in the embedded viewer or shapefiles can be downloaded by clicking the Raw Data link on the top right.
欧洲
- Capitaine European Train Stations-Metadata for all train stations in Europe including latitude and longitude.
美国
- US Street Network Models and Measures-Graph data extracted from OpenStreetMap for road networks in cities and neighbourhoods across the US.
- NYC Taxi Data-纽约出租车数据开放平台
地名
- NGIS Country Files-A list of names of regions, areas and populated places for each country in the world, provided by the US Government, with geo-references for each place.
- Geonames Country Information-List of all countries in the world with ISO and ISO3 country code (eg. GB for the United Kingdom and FR for France) with capital city, area, population, internet top-level domain, currency, official languages and neighbours.
- GRUMP Settlement Points-Locations of individual settlements (as a time series, showing new settlements appearing over time), derived from the Global Rural-Urban Mapping Project
统计数据/社会调查/宏观经济
中国
- 国家数据平台-数据源来自国家统计局,但排版更清晰简洁,包括国计民生各个方面的月度数据、季度数据、年度数据、各地区数据、部门数据以及国际数据。
- 国家统计局-主要包括国家经济宏观数据,社会发展、民生相关重要数据及信息,非常全面,且定期发布统计出版刊物,实用性强。
- 数据-中国政府网-主要包括CPI、GDP、PPI、工业生产增长指数、固定资产投资、社会消费品零售总额、粮食产量等的指数统计,只列出了主要数据,数据来源于国家统计局,点击会跳转至统计局的国家数据网站。查找起来比较简洁清晰,适合需要快速获取这些基础数据的人群。
- 中国人民银行-主要包括社会融资规模、金融统计数据、货币统计、金融机构信贷收支统计、金融市场统计、企业商品价格指数等等,数据权威且容易查找,实用性强。
- 中国银行业监督管理委员会-主要包括银行业的数据统计,包括资产负债规模、主要监管数据等。
- 中国证券监督管理委员会-主要包括证券市场、期货市场相关数据,每天更新快报,并有周报、月报等定期更新。
- 中国银保险监督管理委员会-对银行业和保险业机构的公司治理、风险管理、内部控制、资本充足状况、偿付能力、经营行为和信息披露。
- 中国经济数据库-
- 中国互联网信息中心-
- 中国国家调查数据库-中国国家调查数据库(Chinese National Survey Data Archive, 缩写为CNSDA)受中国国家自然科学基金重点项目资助,由中国人民大学中国调查与数据中心(National Survey Research Center, NSRC)负责执行,是一个经济与社会数据共享的平台。数据内容:是以“中国社会调查开放数据库(Chinese Social Survey Open Database,CSSOD))和中国人民大学科学研究基金“数据高地项目”资助下的各项大型追踪项目和横截面调查数据为基础,收集在中国大陆所进行的各类抽样调查的原始数据及相关资料。数据涵盖了经济、综合、健康、社会、教育、企业、宗教、政治、科学和历史等领域。
- 国家自然科学基金-北京大学管理科学数据中心-成立于2014年12月,是由国家自然科学基金重大项目支持、服务全国管理科学的数据收集与数据服务中心。
- 台湾调查研究与数据档案库-「學術調查研究資料庫」蒐集、保管及整理各類問卷調查資料,並採會員制對外開放資料使用。資料來源包括各大專校院、研究機構進行的學術研究調查計畫,以及政府部會應業務規劃及施政決策需要所辦理的調查統計。網站上可供查詢使用的資料超過2千筆,涵蓋社會、政治、經濟、教育等社會科學重要領域,其中包含多項長期進行的主題型或追蹤調查。各筆資料提供資料檔、問卷、研究報告、資料使用說明,以及利用該資料發表的著作書目。這些資料可作為調查方式或問卷設計之參考,或以不同的研究假設、方法進行分析,產生新的研究成果,亦可以應用於教學活動中,有助於提升學生的統計分析與研究能力。除在網站提供數位課程及在YouTube平台設立SRDA頻道之外,每年也會舉辦資料使用工作坊、研習班、網路研討會,以及提供到校推廣課程服務等,以期觸及更多潛在的資料使用者,並讓資料能被廣泛運用,發揮最大價值。
- Databank for China Studies 中国研究服务中心-1963年成立于香港,由西方研究中国的大陆学者创建。旨在建立一流的地理信息系统兼容的数据库,以便观察中国地方发展的动态。数据库包括333个地级市和 2,862个县的多年度的社会、经济、政治及社会领域内的各种指标。这些指标由人类学、人口统计学、生态学、经济学、教育学、地理学、历史、公共行政管理、政治学、社会工作、社会学等等学科的学者们共同挑选。
地方
直辖市/特别行政区
- 上海市政府数据服务网
- 天津市信息资源统一开放平台-
- 香港-
- 澳门-
广东
- 深圳市政府数据开放平台-
- 开放广东-
- 广东省金融数据开放平台-
- 佛山市政府数据开放平台-
- 广州市政府数据统一开放平台-
- 数据东莞-
- 惠州市政府数据开放平台-
- 珠海市民生数据开放平台-
- 广东省政府数据统一开放平台-潮州市-
- 广东省政府数据统一开放平台-河源市-
- 江门市数据开放平台-
- 中山市政府数据统一开放平台-
- 肇庆市人民政府数据开放平台-
浙江
- 浙江政务服务网“数据开放”专题网站-
- 宁波市政府数据服务网-
贵州
- 贵阳市政府数据开放平台-
- 遵义市政府数据开放平台-
- 铜仁市政府数据开放平台-
海南
- 海南省政府数据统一开放平台-
河南
- 河南省公共数据开放平台-
江西
- 江西省政府数据开放网站-
宁夏
- 宁夏回族自治区数据开放平台-
- 石嘴山政府数据开放平台-
- 银川市城市数据开放平台-
山东
- 山东公共数据开放网-
- 济南市公共数据开放网-
- 青岛公共数据开放网-
陕西
- 陕西省公共数据开放平台-
黑龙江
- 哈尔滨市政府数据开放平台-
安徽
- 合肥市政府数据开放平台-
- 蚌埠市信息资源开放平台-
- 黄山市人民政府数据开放栏目-
湖北
- 武汉市政务公开数据服务网-
湖南
- 长沙市政府门户网站数据开放平台-
江苏
- 苏州市政府数据开放平台-
- 常州市政府数据开放平台-
新疆
- 新疆维吾尔自治区政务数据开放网-
台湾
- 台湾-
全球/其他地区
- Academic Torrents-共享大量数据集的分布式系统,提供445.96TB的研究数据。
- World Bank Data-世界银行开放数据
- St. Louis Federal Reserve Economic Data - FRED-圣路易斯联邦储备银行数据开放网站,该网站提供丰富的经济数据和信息,以促进经济教育和加强经济研究。
- Undata-联合国国际统计数据库,包含6,000多万个数据点,涵盖广泛的统计主题,包括农业,犯罪,通信,发展援助,教育,能源,环境,金融,性别,健康,劳动力市场,制造业,国民核算,人口与移民,科学技术,旅游,运输和贸易。
- 中央情报局世界概况-世界上每个国家的事实;重点研究267个国家/地区的历史,政府,人口,经济,能源,地理,通讯,运输,军事和跨国问题。
- ICPSR-于1962年成立于美国密西根大学安娜堡分校,以大量收集系统化的社会科学数据著称,是世界上最大的社会科学数据中心。 ICPSR研究涉及21个领域,如教育、老龄化、刑事司法、恐怖主义等,储存了超过 50万种社会科学研究资料,包含一个拥有25万份关于研究社会和行为科学文件的档案库。 用户群体:来自40多个国家的700多个成员机构,包括大学和研究中心等。每年网站访客超过60万,每月有5.2万个数据文件下载。 数据来源:儿童和家庭机关、卫生部门和公共事业,Alfred P. Sloan基金、Henry Luce基金、美国心理协会、卫生与人类服务部疾病预防控制中心、联合国粮食和农业组织、博物馆与图书馆服务研究所、全国大学生体育协会、国家艺术基金会、国家儿童健康和人类发展研究院、国家老化研究所、国家药物滥用研究所、国家科学基金会、司法部司法程序办公室、Robert Wood Johnson基金会、Spencer基金会、美国国际开发署、美国退伍军人事务部等。
- National Data Archive on Child Abuse and Neglect-成立于1988年,由美国康奈尔大学人类生态学学院创建。是一个用于促进儿童虐待领域研究者之间进行学术交流的资源库。 数据来源:相关领域的研究人员和国内数据收集资料。 研究领域:儿童虐待与忽视。
- Data & Information Service Center-由威斯康辛大学麦迪逊分校创办。为在社会科学方面进行二级分析的研究员和学生提供了定量数据和数字数据,对于不熟悉统计软件的用户,其拥有一系列基于菜单界面的软件产品。 数据收集范围:纵向调查、宏观经济指标、选举研究、人口研究、社会化模式、贫困措施、劳动力参与、民意调查、教育和健康以及户口普查数据。 用户群体:仅对UW-Madison大学的学生、教师和工作人员开放。
- Harvard-MIT Data Center-1960年在哈佛大学作为对政治和社会科学的原始数据中心而成立,它是定量社会科学机构的一个成员。使命是研发和提供世界顶级的研究计算资源、数据服务和支持信息技术,为了将社会科学研究和教育发展得更远。近些年来HMDC通过艺术科学部门和哈佛大学的其他学校,已经逐渐演变成了为社会科学研究和教育领域提供信息技术服务的提供者。它能提供先进的计算机设备和基础设施,包括功能强大且方便使用的研究计算工具、集群计算、应用程序和服务器托管和现场计算机实验室。HMDC还提供统计研讨会和班级、用户界面友好的桌面支持,其也将继续为哈佛大学和麻省理工大学担任社会科学数据经销商。
- Roper Center for Public Opinion Research-由美国康奈尔大学始建于1947年,是世界上关于社会科学数据的顶级数据中心之一,尤其是在公众舆论调查方面。中心的任务是收集、保存和传播公众舆论数据。用户群体:会员,会员机构大多是学校、科研机构、政府等,目前会员数量已有280个。 网站包含的数据主要是关于选举的数据。数据来源:通过商业调查公司来调查的国家、州和其他一些关于公众舆论的调查数据,也有来自美国国家民意研究中心和普林斯顿大学公共舆论研究室的一些学术数据。目前已有超过12000个美国国内的数据集和8000多个国外的数据集。
- General Social Survey-由美国芝加哥大学创建于1972年。目前该平台只有GSS一个项目的数据。主要研究美国社会日益增长的复杂性,从1972年开始,目前已调查了44年,是唯一一个用以监测美国社会特征和态度变化的全概率的面对面访谈调查。研究领域:公民自由、犯罪和暴力、种族宽容、道德、国家支出重点、心理健康、社会流动、压力和创伤性时间等。用户群体:研究者、学生、政策制定者、记者等,每年的学生用户就有40万人。
- -
其他
- 新加坡政府开放数据-
- New Zealand Institute Of Economic Research – Data1850-新西兰经济研究所,可在该网站下载自1850年以来的相关经济数据。
- 瑞典统计局-提供瑞典国家统计数据,包含26个数据集。
- Open Government Data Platform India-印度开放政府数据(OGD)平台
- Data.Gov.Uk-有来自英国所有中央部门以及许多其他公共部门和地方当局的数据集。它充当有关一切信息的门户,包括商业与经济,犯罪与正义,国防,教育,环境,政府,卫生,社会和交通运输。
- 欧盟开放数据-数据包括欧盟内部的经济发展以及欧盟机构内部的透明度,包括地理,地缘政治和金融数据,统计数据,选举结果,法律法规以及犯罪,健康,环境,交通运输和科学研究的数据。
- 加拿大开放数据-包含许多政府和地理空间数据集的试点项目。它可以帮助您探索加拿大政府如何通过开放数据,开放信息和开放对话来提高透明度,加强问责制,提高公民参与度并推动创新和经济机会。
- Datacatalogs.Org-它提供来自美国,欧盟,加拿大,CKAN等的开放政府数据。
- 英国数据服务-英国数据服务集合包括英国政府资助的主要调查,跨国调查,纵向研究,英国人口普查数据,国际总量,商业数据和定性数据。
- UK Data Archive-UK Data Archive1967年成立于英国埃塞克斯大学,是一个国际公认的为社会科学和人文学科获取、管理和提供数据的专业技术中心。目的是为了分析和再次利用而收集高质量的研究数据。 数据来源:大规模的政府调查,例如劳动力调查;英国主要的调查,例如英国家庭小组调查、民意测验以及环境研究项目的多媒体定性数据资源。研究领域:老龄化、犯罪、经济、教育、环境与能源、种族、食品和食品安全、健康与健康行为、房屋和当地环境、信息与交流、劳动力市场、政治、贫困和社会歧视等。
- Data.gov.uk-Data.gov.uk是由英国政府创办的可以快速查找政府服务和信息,英国政府部门,英国相关政策等与政府和民生息息相关的网站,并且所有政府部门和许多其他机构、公共机构的网站都被收录到了这里。 数据来源:中央政府部门、一些其他公共机构和地方当局 研究领域:商业和经济数据、环境、犯罪与司法、政府、社会、保卫、政府支出、乡镇和城市、教育、健康和运输等方面。用户群体:主要为英国公民,网站共有30074328次点击量,其中81%来自英国,3%来自美国,0.65%来自中国。
- Australian Social Science Data Archive澳大利亚社会科学数据库-由澳大利亚国立大学创建于1981年,目的是将收集和保存的研究数据提供给学术研究人员和其他用户进行二次分析。数据涵盖的领域有:社会科学、历史、犯罪与司法等等。该平台储存的数据类型有定性数据、定量数据、时间序列、面板数据和纵向数据。目前可以使用的数据集超过2000个。数据来源:澳大利亚社会调查、民意调查、人口普查及包括亚太地区在内的其他一些国家的数据。用户群体:大学、政府和其他部门社会科学研究人员。
- The British Columbia Inter-university Research Data Centre不列颠格伦比亚校际研究中心-由加拿大创新基金和大学合作创建,是不列颠哥伦比亚省的四所大学(西蒙弗雷泽大学、不列颠哥伦比亚大学、维多利亚大学和北不列颠哥伦比亚大学)的研究机构,这项合作旨在加强成员学校学生及教职工的研究能力。数据内容包括:国家人口健康调查、全国儿童和青少年纵向调查、劳动和收入动态调查、工作场所和员工调查以及青年调查。用户群体:目前只对以上四所大学(SFU、UBC、UNBC和Uvic)中有项目的学生或老师开放。
- SDA Sociological Data Archive捷克社会学数据档案-成立于1998年,由捷克共和国科学院社会学研究所创建。其目的是处理、记录和存储社会科学研究项目的数据文件,并促进其传播,使其广泛用于学术研究的二次利用和教育。该数据库的数据涵盖历史数据、经济预期和态度、选举调查、ISSP、社会转型、住房调查、青年调查、志愿服务等领域;其拥有的数据集超过十万个。主要用户群体为国内外研究者,年均服务7000用户,学术信息供超过20万研究者使用。
- The Danish Data Archive-丹麦文化部的下属机构(类似于国家图书馆),主要是收集和存储历史数据,并将其提供给公众。数据来源:丹麦政府,由国家档案馆安排和转移材料。用户群体:想寻找自己祖先的人群,对历史比较感兴趣的人群以及致力于历史学的研究人员或学生。
- Council of European Social Science Data Archives-于1976年创建,旨在为科研人员提供大型的、综合的和可持续的社会科学服务,加强和扩大与欧洲其他社会科学机构合作,提升数据的质量,促进和提高社会科学和人文科学的可视化,目前已有15个欧洲国家是其成员国。
- 欧洲社会调查(ESS)-成立于2001年,是一个欧洲范围内的跨国调查,主要目的是了解社会结构的稳定与变化,解释欧洲社会、政治、道德结构是如何变化的。研究来自欧洲30多个国家的多样化的人群的态度、信念和行为模式。研究领域:媒体和社会信任、政治、主观幸福感、性别与家庭、社会人口统计、人类价值观、移民、公民参与、健康与保健、家庭和幸福工作、寿命、个人幸福、福利、年龄歧视、正义、民主、健康方面的社会不平等、公众对气候变化的态度。
- ESSDA: Estonian Social Science Data Archive-爱沙尼亚社会科学数据档案库由爱沙尼亚塔尔图大学创办于1996年,其涵盖的领域主要有:新闻学、农村社会学、教育社会学、家庭研究、性别研究、城市社会学、越轨社会学、民族政策。数据库提供两种数据检索方式:首字母检索和关键字检索。
- The Réseau Quetelet-处于数据委员会政策框架下的法国社会科学数据档案库。其任务围绕着三个方面展开:数据归档、免费分发、发展数据。数据来源:Maurice Halbwachs中心(ADISP)、社会政治数据中心(CDSP)、INED数据服务。目前,可获取的数据集超过1100个。用户群体:法国和外国研究人员、博士生、博士后学生和硕士研究生。用户不仅可以通过数据库下载法国本地研究数据,还可以寻找国际研究数据用以比较研究,一些特定机构或部门还可以获取保密数据。
- Finnish Social Science Data Archive-由芬兰教育和文化部成立的国家资源中心,主要任务是采集、处理和保存数据,向用户提供数据及与数据相关的信息服务,例如:数据二次利用、数据研究方法等。研究领域:老龄化和老人、孩子/童年与家庭、芬兰选举、当地政府、媒体、健康、移民外国人和种族主义、贫困、性与性别、体育与健身活动、福利与社会关系、工作与生活、青少年,目前,该平台已拥有1259个数据集。用户群体:芬兰的大学、理工学院以及研究机构的学生以及工作人员。
- GESIS-成立于1986年,是德国最大的社会调查机构,目前有300名员工为研究者提供大量的、全面的、国际相关的调查;其专业的知识和服务随时准备回答各级研究人员在最新科学方法基础上与社会相关的问题。研究领域:调查方法、应用计算机和信息科学和社会科学调查。在研项目有:女性和性别调查、历史调查、社会指标调查、社会结构分析、选举与政治研究、价值观与态度研究。
- SRIC/TARKI Social Research Informatics Center (Budapest)-T?RKI成立于1985年,在匈牙利有超过25年的社会科学研究经验。旨在为研究者提供基础设施服务。研究领域:社会分层、劳动力市场、收入分配、消费、生活方式和态度和市场研究。TARKI的客户群体包括政府机构、科研组织、国际组织和私人企业。
- ISSDA:Irish Social Science Data Archive-由爱尔兰国际大学创办。是爱尔兰领先的定量数据获取、保存和传播中心。其任务是确保广泛获取社会科学的定量数据集并促进在爱尔兰经济和社会方面的国际比较研究。数据内容主要包括:意见调查数据、全国家庭调查(QNHS)、学校毕业生调查、公众对残疾态度的调查、爱尔兰公众对于林业的态度调查、生活方式和营养态度调查(SL?N)、Teagasc国家农场调查(NFS)、爱尔兰老年纵向研究(TILDA)等。用户群体:公共和商业部门的学生以及学术界的研究人员
- Center for Social Research on Japan: Social Science Japan Data Archive日本社会科学数据档案-日本社会调查信息中心2009年由东京大学创建,它是一个日本社会调查数据的综合档案库,负责收集、编制、数字化日本社会的微观数据,目的是促进社会调查数据的再次利用。数据主要内容:仅包含JGSS一个项目的数据(类似于中国的CGSS)。1998年-2015年底,SSJDA共有可用数据集1935个,申请者数量累计22907人,数据提供者累计35759人,累计发表文章1692篇,使用在线搜索系统的累计569017人次,访问的数据列表累计148332次。用户群体:研究人员和学生
- Korean Social Science Data Archive-于1983年由Lee Inpyo基金会创立,其主要目标是汇编和提供韩国定量和定性数据以及文献的综合数字档案。研究领域:政治、公共行政和法律、经济和商业管理、社会文化、社会问题、社会福利、心理学和教育和区域研究。用户群体:个人和组织。个人主要包括学生、学者和研究人员;组织主要包含学校图书馆、研究机构公有或私有组织。
- Korean Social Science Data Center-于1997年成立,旨在建立一个管理社会科学数据综合来源的新系统,中心收集和管理与社会科学研究相关的调查数据和统计数据,帮助统计基础较差的学生和学者。数据涵盖的领域有:政治、选举、管理、社会、文化、教育、环境、健康、法律、女性、科学及通讯。数据类型有:国家或地区层面的截面数据与时间序列数据。用户群体:学者和学生,仅对会员开放。
- Data Archiving and Networked Services-荷兰的一个数据中心,致力于推动数字研究数据文件的可持续获取,鼓励研究人员归档、再利用数据。主要提供三种核心服务:数据归档、数据再利用和培训及咨询。数据主要来自瓦赫宁根大学等24个科研机构,目前汇集了超过6万研究的16余万数据集以供用户对数据进行二次研究。
- Norwegian Social Science Data Service-挪威最大的数据中心之一,是由教育和研究部创建的有限公司。为挪威及国外的研究者和学生提供数据。此外,NSD是资源中心,协助研究人员收集数据、分析数据、提供方法等。目前该平台提供的数据包含:个人层面数据(个人调查的数据)、地区层面数据(包括范围广泛的数据,如人口统计数据、就业、经济发展和政治制度等)、政治系统数据、机构层面数据(描述组织机构、企业、大学等)。
- The Slovenian Social Science Data Archives-于1997年创建于斯洛文尼亚的卢布尔雅那大学,旨在获得社会科学家感兴趣的关于社会科学的数据,审查并电子化这些数据以备他人使用,目前保存了社会学科方面的600个调查。该平台的数据涵盖了人口学、人口、人口统计和普查、经济、教育、健康、房地产、信息和通信等领域。用户群体:国家和国际研究者、教师以及具有数据和统计素养的学生。数据一般用于科学报告和研讨会。数据也被用来做学生教学和实践练习的背景资料,还可以提供可用于设计新研究的相关数据(例如原始问卷和测量仪器)等。
- CIS马德里社会调查中心-该中心主要通过开展定量、定性研究以此来分析并推进西班牙社会科学知识的发展。研究主要通过两种方式开展:中心自身开展或通过与公共机构或非营利组织合作来实现。研究领域:选举调查、有关青年、移民、生活、公共安全、政治文化的专题调查、消费者信心指数和国际调查。
- Swedish National Data Service-由瑞典研究理事会创办,总部位于哥德堡大学。是瑞典调查与调查数据的基础。帮助瑞典和国际上的研究者获得瑞典和其他地区的已有的数据,为研究者提供整个调查流程的指导服务。研究领域:历史学、考古学、医疗和健康科学、政治学、媒体和交流、健康科学、公众健康/全球健康/社会医疗、社会科学、临床医学。数据来源:乌普萨拉大学、瑞典国家数据服务、瑞典哥德堡大学、于默奥大学、隆德大学、瑞典公共卫生机构等。
美国
- 美国政府开放数据-
- United States Census Bureau-美国人口普查局
- NASA SocioEconomic Data And Applications Center - SEDAC-社会经济数据和应用中心,是美国国家航空航天局地球观测系统数据和信息系统(EOSDIS)中的分布式主动档案中心(DAAC)之一。
- 美国国家教育统计中心-国家教育统计中心(NCES)是收集和分析与美国和其他国家/地区的教育相关数据的主要联邦实体。
- TIGER-US-wide census data.
- TIGER/Line 2010-2010 extracts from the census database. These files contain the boundaries of census areas, which can then be linked to census data tables.
- US Census Grids-Raster griddded datasets for census variables across the US for data from 2000. Approximately 1km resolution.
- Archive of Census-related Products-A range of census-related products produced by a research project at CIESIN including boundary, migration and microdata samples.
- TOD Database-Economic and demographic information for areas around fixed transit station in the US. Available at three levels - 1/2 mile buffer around station, aggregated transit zones, transit regions.
- Integrated Health Interview Series-由美国国家儿童健康和人类发展研究所创办的。旨在收集和整合1963年至今可获得的关于美国公民健康、医疗保健覆盖和健康行为的数据。以方便研究者分析每样本跨时间的变化。目前该网站的整合的数据有:1850年至今的美国人口普查数据和社区调查数据;1962年至今的当前人口调查包括每月的补充调查;1960年至今的覆盖82个国家的人口普查微数据;1980年至今的跨时间与地区的人口与健康综合调查;1960年至今的人口与环境整合数据;1960s年至今的国家健康访谈调查数据;1993年至今的科学和工程劳动力方面的调查数据等。
地方
- 纽约政府开放数据平台-
- 休斯顿市开放数据网站-
- 费城开放数据平台-
- 旧金山政府开放数据网站-
- 美国国家教育统计中心-国家教育统计中心(NCES)是收集和分析与美国和其他国家/地区的教育相关数据的主要联邦实体。
- -
文献/档案
- SCI hub-你懂的,最常用
- 谷歌学术-goooooood!
- 百度学术-没有机场就用这个吧
- ResearchGate-学术交流社区,部分作者会上传自己的论文进行共享。
- Figshare.Com-研究论文上传网站
- The GDELT Project-GDELT博客是世界上最大的人类社会开放研究平台的最新新闻,公告,信息和应用程序的官方一站式存储库。
- 复旦大学社会科学数据平台-旨在收集、整理和开发中国社会经济发展数据,为学者提供有最具竞争力的研究条件和数据服务,为学生提供更加坚实的社会科学调查方法和应用的训练,鼓励跨学科的研究,为复旦大学履行大学传承、记录文明的职责和成为 “国家智库”提供重要和基础性的支撑。数据类型:研究论文、学位论文、研究报告、政策法规、专项调查及统计年鉴。
- arXiv-arXiv is a free distribution service and an open-access archive for 1,663,247 scholarly articles in the fields of physics, mathematics, computer science, quantitative biology, quantitative finance, statistics, electrical engineering and systems science, and economics. 有论文的共享数据下载
- -
百科/wiki/其他类别
- 维基百科数据-维基百科数据
- Grouplens.Org-提供9个数据集,关于书籍、电源、wiki数据集
- MapLight-关于货币的数据集
标准数据集(验证算法用)
- UC Irvine Machine Learning Repository-加州大学欧文机器学习库,提供481个数据集
- Liver Tumor Segmentation Challenge Dataset-
- iNaturalist Challenge at FGVC 2017-
数据综合网站/搜索引擎
这个类目下汇总了一些网站,它们同样也搜集整理了比较全的免费共享的数据清单或提供下载服务,它们列出的部分数据可能跟以上所列数据有重复:
- 城市数据派
- Hadoopilluminated.Com-提供国外开放数据网站相关信息,目前已集合35个查询途径
- Datahub.Io-发现和分享高质量数据集,与他人联系和分享知识。
- Enigma.Com -快速搜索和分析政府、公司和组织发布的数十亿份公共记录。
- Aws.Amazon.Com/Datasets-帮助人们发现和共享通过AWS资源提供的数据集。
- Quandl.Com-金融,经济和替代数据集的主要来源,为投资专业人士提供服务。Quandl的平台被超过40万人使用,其中包括来自世界顶级对冲基金,资产管理公司和投资银行的分析师。
- Quora’s Big Datasets Answer-Quora上关于开放数据的回答汇总
- Kaggle Datasets-最火的Kaggle数据挖掘竞赛网站
- Google Dataset Search-谷歌公开数据搜索网站
- Research-Quality Data Sets By Hilary Mason-公共数据集汇总
- R/Datasets-开放数据集汇总网站
- Dept. Of Politics @ New York University-纽约大学政治数据中心
- Github Free Data Source List-Github用户对开放数据源的总结
- StackExchange Data Explorer-一个开源工具,用于对来自StackExchange网络的公共数据进行任意查询。
- IBM Blog Abour Open Data-开放数据源汇总
- Microsoft Research Open Data-来自Microsoft Research的免费数据集,以推进自然语言处理,计算机视觉和特定领域科学等领域的最新研究。
- GHTorrent-
- -
数据交易平台
这个类目下汇总的网站上的数据,大部分需要付费:政策法规及相关文献
- 《促进大数据发展行动纲要》
- 《中国大数据交易白皮书(2015、2016)》
- 我国大数据交易模式研究
交易平台
政府平台
- 贵阳大数据交易所-我国乃至全球第一家大数据交易所, 贵阳大数据交易所发展会员数目突破2000家,已接入225家优质数据源,经过脱敏脱密,可交易的数据总量超150PB,可交易数据产品4000余个,涵盖三十多个领域,成为综合类、全品类数据交易平台。
- 西咸新区大数据交易所-西咸新区沣西大数据产业发展平台,通过构建有效的市场机制,聚合政府、企业、社会等多类数据资源,整合大数据服务能力,全面运营大秦大数据银行线上服务平台和陕西省社会数据服务大厅线下服务平台。
- 东湖大数据交易中心-武汉东湖大数据交易中心股份有限公司的业务涵盖数据交易与流通、数据分析、数据应用和数据产品开发等,聚焦“大数据+”产业链,提供有价值的产品和解决方案,帮助用户提升核心竞争力。
- 华东江苏大数据交易平台-华东江苏大数据交易中心(简称BDEX)是在实施“国家大数据战略”大背景下,经国家批准的华东地区首个领先的跨区域、标准化、权威性省级国有大数据资产交易与流通平台,2015年11月成立于国家级大数据产业基地——江苏盐城大数据产业园,承担助推江苏省国有数据增值开放流通、大数据产业发展之重任。
- 哈尔滨数据交易中心-哈尔滨数据交易中心由黑龙江省政府办公厅组织发起并协调省金融办、省发改委、省工信委等部门批准设立。结合政府数据资源、企业数据资源,打造成为立足东三省,辐射全国的大数据交易市场,构建围绕数据的生态系统支撑平台。
- 上海数据交易中心-上海数据交易中心有限公司(简称“上海数据交易中心”),是经上海市人民政府批准,上海市经济和信息化委、上海市商务委联合批复成立的国有控股混合所有制企业,上海数据交易中心承担着促进商业数据流通、跨区域的机构合作和数据互联、政府数据与商业数据融合应用等工作职能。
- 中国工信数据
- 华中大数据交易所-华中大数据交易所是经湖北省政府批准,由北京东华软件股份公司等3家IT企业注资1亿元成立的全国首个跨区域、标准化、综合性的大数据交易平台。
- 重庆大数据交易市场-重庆大数据交易市场是由北京数海集团和重庆大数据交易市场共同出资成立的。致力于建设重庆大数据交易市场。
- 浙江大数据交易中心-浙江大数据交易中心将遵循国有控股、政府指导、市场化运营的指导方针,致力于打造具有公信力、开放、客观、独立的全国第三方数据交易中心。
企业平台
- 京东万象-以数据开放、数据共享、数据分析为核心的综合性数据开放平台,拥有的数据类型主要包括金融、征信、电商、质检、海关、运营商数据。
- 聚合数据-互联网专业数据科技服务商。主要提供两种核心服务:以API数据接口的形式,提供数据服务;以大数据技术,提供数据应用服务。
- 数据宝-中国领先的国有数据资产增值运营服务商,提供 公安、运营商、银联、交通、车辆、企业、税务、气象大数据。
- 百度智能云云市场-由百度智能云建立的云计算软件或商品的交易与交付平台,下设多个商品品类,包括镜像环境、建站推广、企业应用、人工智能、数据智能、区块链、泛机器人、软件工具、安全服务、上云服务、API服务等,商品数量数千种。
- 数粮-大数据领域的流通平台,供数据资源和大数据技术应用产品进行交易,支持API接口、数据包下载、定制等交易模式。
- 阿凡达数据-API数据接口云服务,专注于数据的采集与分析处理工作,拥有106个数据种类。
- HaoService-数据互联服务平台。提供30大类以上基础数据API服务、热门源码交易服务。
- 发源地-大数据应用平台和大数据解决方案提供商。提供数据交易服务,目前总共拥有20246个数据源。
- IDataAPI-数据服务提供商,已推出1300多种数据产品和50多种数据分析产品,涵盖30000个网站平台和全球移动APP平台。
- 天元数据-中国领先的云计算、大数据服务商。数据商品涵盖了线上零售、生活服务、企业数据、农业、资源能化等10大类。提供17个API接口、165个数据集、56个数据报告、278个政府开放数据。
- 中原大数据交易-数据资源提供商、数据资产运营商和数据交易服务商,向客户提供大数据全产业链平台与技术服务。提供223个API接口、177个数据集、89个数据报告、2个数据应用。
- 环境云-环境大数据开放平台。拥有3702家注册用户、收录1,041,098,354条环境数据,以积分兑换和免费下载两种方式提供数据服务。
- 天眼查-天眼查收录了1.8亿+家社会实体信息(含企业、事业单位、基金会、学校、律所等),90多种维度信息全量实时更新。
- 企查查-提供企业工商信息、法院判决信息、关联企业信息、法律诉讼、失信信息、被执行人信息、知识产权信息、公司新闻、企业年报等企业数据交易服务,覆盖全国1.8亿家企业信息。
- 杭州钱塘大数据交易中心-杭州钱塘大数据交易中心有限公司(简称“钱塘数据”)成立于2015年底,是国内一家工业大数据应用和交易平台。
- 中关村数海大数据交易平台-全国第一家数据交易平台,推动数据的流通,发挥数据的商品属性,促成数据交换、整合,将真正带动大数据产业繁荣。
- 大数据挖掘模型交易平台-模型算法交易平台,配套完整建模数据,模型实现过程说明及源代码。
- APIX-APIX是黑格科技旗下的一款SaaS云服务产品,专注为机构提供实时在线用户数据分析,信用评估,第三方数据接入服务。
- 抓手数据-运用区块链底层技术,以生产数据产品、建立数据交易生态圈为主要目标,促进数据的开放共享和数据价值的释放。
- 千教堂-全球大数据众享平台
- 中国数据商城-中国领先的大数据交易平台
- 中国管理大数据-管理大数据RBD=平台运营商+数据供应商
- 数据星河-是全球首款大数据产业链生态平台,基于国际主流的大数据生态技术研发,结合先进的大数据资产运营理念,汇聚全球近千家大数据公司 。
- 数据堂-数据堂(北京)科技股份有限公司正式成立于2011年6月,是一家专注互联网综合数据服务的公司。 数据堂客户包括百度,腾讯,阿里巴巴、奇虎360、联想、科大讯飞等国内顶级互联网和高科技企业,Microsoft、NEC、Canon、Intel、Samsung、Nuance、Fujitsu等国外企业及在华研发机构。
- 百度APIStore-百度旗下产品,APIStore,为开发者提供最全面的API服务,汇集了国内外应用开发所需的Android/IOS API 和SDK,涉及到设计开发,运维管理,云服务,app推广,数据服务等5个范畴的服务,我们志在向开发者提供最全面,最便捷的API搜索服务。