拉取最新县及县以上行政区划代码

本贴最后更新于 1665 天前,其中的信息可能已经渤澥桑田

最新县及县以上行政区划代码(截止 2016 年 7 月 31 日)

url:http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201703/t20170310_1471429.html(网站 404)

更多数据

可以通过 UNPKG 下载使用 CDN 资源: https://unpkg.com/province-city-china/dist/

文件列表 JSON CSV SQL CDN
总数据(省/地/县/乡) data.json data.csv data.sql data.sql / csv / json
省/地/县/乡层级数据 level.json - - level.json
省级(省/直辖市/特别行政区) province.json province.csv - province.json / csv
地级(城市) city.json city.csv - city.json / csv
县级(区县) area.json area.csv - area.json / csv
乡级(乡镇/街) town.json town.csv - town.json / csv
县市区没有乡级数据

参考代码:http://www.thinksaas.cn/topics/0/353/353549.html
工具:jsoup

import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.PreparedStatement;
import java.sql.SQLException;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.logging.Level;
import java.util.logging.Logger;

import org.apache.commons.lang3.StringUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class getpcd {

	/**  
	 * All rights Reserved, Designed By www.vps6.win
	 * @Title:  getpcd.java   
	 * @Package   
	 * @Description:    TODO(用一句话描述该文件做什么)   
	 * @author: liuchao     
	 * @date:   2017年4月27日 下午10:52:40   
	 * @version V1.0 
	 * @Copyright: 2017 www.vps6.win Inc. All rights reserved. 
	 * 
	 */
	private static final Logger log = Logger.getLogger("xzqhdm");
	private static final String separator = "#";
	public static void main(String[] args) throws Exception {
		List<String> list = getData();
		for(String s : list){
			System.out.println(s);
		}
		saveData(list);
	}

	private static List<String> getData() throws Exception {
		List<String> retList = new ArrayList<String>();
		Map<String,String> map = new HashMap<String,String>();

		Document doc = Jsoup.connect("http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201703/t20170310_1471429.html").post();
		Elements ps = doc.select(".TRS_PreAppend p");
		for (Element e : ps) {
			Elements spans = e.select("span");
			Element firstE = null;
			Element secondE = null;;
			
			if(spans.size() == 3){
				//一级
				firstE = spans.first();
				secondE = spans.get(2);
			}else{
				//二级/三级
				firstE = spans.get(1);
				secondE = spans.get(3);
			}
			String key = StringUtils.trim(firstE.ownText());
			map.put(key, key+separator+StringUtils.trim(secondE.ownText().replace(" ", ""))+ separator + key.substring(0, 4)+"00"+separator+"3");
			if (key.endsWith("0000")) {
				map.put(key, key+separator+StringUtils.trim(secondE.ownText().replace(" ", ""))+ separator+"0"+separator+"1");
				//key = key.substring(0, 2);
			} else if (key.endsWith("00")) {
				map.put(key, key+separator+StringUtils.trim(secondE.ownText().replace(" ", ""))+ separator+key.substring(0, 2)+"0000"+separator+"2");
				//key = key.substring(0, 4);
			}
			if(map.get(key) == null){
				System.out.println(key);
			}
			retList.add(map.get(key));
		}
		return retList;
	}

	private static void saveData(List<String>  list) {
		Connection conn = null;
		PreparedStatement pstmt = null;
		try {
			Class.forName("com.mysql.jdbc.Driver");
			conn = DriverManager.getConnection(
					"jdbc:mysql://localhost/test?characterEncoding=utf8&zeroDateTimeBehavior=convertToNull",
					"root", "root");
			conn.setAutoCommit(false);// 事务不自动提交

			pstmt = conn.prepareStatement("delete from code");
			int count = pstmt.executeUpdate();
			log.log(Level.INFO, "___删除数据" + count);

			int batch = 500;// 一次插入多少笔
			int loop = list.size() / batch;// batch可以循环的次数
			int last = list.size() - batch * loop;// 最后剩余
			int start = 0;// list从哪开始取数据
			int index = 1;// 问号参数
			int allCount = 0;// 统计总共插入多少数据

			for (int i = 0; i < loop; i++) {
				index = 1;// 重置到第一个问号参数
				pstmt = conn.prepareStatement(getPreSql(batch));
				for (int j = start; j < start + batch; j++) {
					String[] s = list.get(j).split(separator);
					for (int k = 0; k < s.length; k++) {
						pstmt.setString(index, s[k]);
						index++;
					}
				}
				count = pstmt.executeUpdate();
				allCount += count;
				log.log(Level.INFO, "___插入数据" + count);
				start += batch;
			}

			if (last > 0) {
				index = 1;// 重置到第一个问号参数
				pstmt = conn.prepareStatement(getPreSql(last));
				for (int j = start; j < list.size(); j++) {
					String[] s = list.get(j).split(separator);
					for (int k = 0; k < s.length; k++) {
						pstmt.setString(index, s[k]);
						index++;
					}
				}
				count = pstmt.executeUpdate();
				allCount += count;
				log.log(Level.INFO, "___插入数据" + count);
			}
			log.log(Level.INFO, "___一共插入" + allCount);

			conn.commit();// 提交事务
			conn.setAutoCommit(true);// 还原现场

		} catch (ClassNotFoundException e) {
			log.log(Level.SEVERE, "___找不到MySQL驱动包" + e.getMessage());
			e.printStackTrace();
		} catch (Exception e) {
			log.log(Level.SEVERE, "___执行SQL异常" + e.getMessage());
			e.printStackTrace();
			try {
				if (conn != null) {
					conn.rollback();
					conn.setAutoCommit(true);// 还原现场
					log.log(Level.WARNING, "___回滚数据");
				}
			} catch (SQLException e1) {
				log.log(Level.SEVERE, "___回滚异常" + e.getMessage());
				e1.printStackTrace();
			}
		} finally {
			try {
				if (pstmt != null) {
					pstmt.close();
				}
				if (conn != null) {
					conn.close();
				}
			} catch (SQLException e) {
				log.log(Level.SEVERE, "___关闭数据库连接异常" + e.getMessage());
				e.printStackTrace();
			}
		}
	}

	/**
	 * 生成sql
	 *
	 * @return
	 */
	private static String getPreSql(int count) {
		StringBuilder sb = new StringBuilder();
		sb.append("INSERT INTO `code` (`code`, `name`,`pcode`,`type`) VALUES");
		for (int i = 0; i < count; i++) {
			sb.append("(?, ?, ?, ?),");
		}
		return sb.substring(0, sb.length() - 1);
	}
}

  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3169 引用 • 8208 回帖
  • JSONP
    4 引用 • 11 回帖
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    675 引用 • 535 回帖
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖
1 操作
alanfans 在 2019-12-31 15:32:46 更新了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • lijp

    //

  • 其他回帖
  • lijp

    评论框里,不能直接输入 js 代码,应该是屏蔽了。

    1 回复
  • Java 在做这类事情上 还是感觉代码好多 哈哈

    1 回复
  • lijp

    我上周六刚好用 js 谢了一段代码,也是访问统计局的这个页面。
    js 不太会写,写的比较 low。

  • 查看全部回帖

推荐标签 标签

  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1083 引用 • 3461 回帖 • 257 关注
  • 自由行
    1 关注
  • FreeMarker

    FreeMarker 是一款好用且功能强大的 Java 模版引擎。

    23 引用 • 20 回帖 • 429 关注
  • 禅道

    禅道是一款国产的开源项目管理软件,她的核心管理思想基于敏捷方法 scrum,内置了产品管理和项目管理,同时又根据国内研发现状补充了测试管理、计划管理、发布管理、文档管理、事务管理等功能,在一个软件中就可以将软件研发中的需求、任务、bug、用例、计划、发布等要素有序的跟踪管理起来,完整地覆盖了项目管理的核心流程。

    6 引用 • 15 回帖 • 182 关注
  • OkHttp

    OkHttp 是一款 HTTP & HTTP/2 客户端库,专为 Android 和 Java 应用打造。

    16 引用 • 6 回帖 • 48 关注
  • 人工智能

    人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

    77 引用 • 159 回帖
  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    35 引用 • 35 回帖
  • GitLab

    GitLab 是利用 Ruby 一个开源的版本管理系统,实现一个自托管的 Git 项目仓库,可通过 Web 界面操作公开或私有项目。

    46 引用 • 72 回帖
  • FFmpeg

    FFmpeg 是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。

    23 引用 • 31 回帖 • 8 关注
  • Quicker

    Quicker 您的指尖工具箱!操作更少,收获更多!

    26 引用 • 85 回帖
  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    536 引用 • 672 回帖
  • 创业

    你比 99% 的人都优秀么?

    83 引用 • 1398 回帖
  • IDEA

    IDEA 全称 IntelliJ IDEA,是一款 Java 语言开发的集成环境,在业界被公认为最好的 Java 开发工具之一。IDEA 是 JetBrains 公司的产品,这家公司总部位于捷克共和国的首都布拉格,开发人员以严谨著称的东欧程序员为主。

    180 引用 • 400 回帖 • 1 关注
  • Sandbox

    如果帖子标签含有 Sandbox ,则该帖子会被视为“测试帖”,主要用于测试社区功能,排查 bug 等,该标签下内容不定期进行清理。

    386 引用 • 1226 回帖 • 593 关注
  • Google

    Google(Google Inc.,NASDAQ:GOOG)是一家美国上市公司(公有股份公司),于 1998 年 9 月 7 日以私有股份公司的形式创立,设计并管理一个互联网搜索引擎。Google 公司的总部称作“Googleplex”,它位于加利福尼亚山景城。Google 目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务。不作恶(Don't be evil)是谷歌公司的一项非正式的公司口号。

    49 引用 • 192 回帖
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 641 关注
  • 开源中国

    开源中国是目前中国最大的开源技术社区。传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台。目前开源中国社区已收录超过两万款开源软件。

    7 引用 • 86 回帖
  • Oracle

    Oracle(甲骨文)公司,全称甲骨文股份有限公司(甲骨文软件系统有限公司),是全球最大的企业级软件公司,总部位于美国加利福尼亚州的红木滩。1989 年正式进入中国市场。2013 年,甲骨文已超越 IBM,成为继 Microsoft 后全球第二大软件公司。

    103 引用 • 126 回帖 • 443 关注
  • IPFS

    IPFS(InterPlanetary File System,星际文件系统)是永久的、去中心化保存和共享文件的方法,这是一种内容可寻址、版本化、点对点超媒体的分布式协议。请浏览 IPFS 入门笔记了解更多细节。

    20 引用 • 245 回帖 • 239 关注
  • Linux

    Linux 是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX 和 Unix 的多用户、多任务、支持多线程和多 CPU 的操作系统。它能运行主要的 Unix 工具软件、应用程序和网络协议,并支持 32 位和 64 位硬件。Linux 继承了 Unix 以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。

    923 引用 • 936 回帖
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖
  • frp

    frp 是一个可用于内网穿透的高性能的反向代理应用,支持 TCP、UDP、 HTTP 和 HTTPS 协议。

    16 引用 • 7 回帖 • 1 关注
  • Love2D

    Love2D 是一个开源的, 跨平台的 2D 游戏引擎。使用纯 Lua 脚本来进行游戏开发。目前支持的平台有 Windows, Mac OS X, Linux, Android 和 iOS。

    14 引用 • 53 回帖 • 520 关注
  • LeetCode

    LeetCode(力扣)是一个全球极客挚爱的高质量技术成长平台,想要学习和提升专业能力从这里开始,充足技术干货等你来啃,轻松拿下 Dream Offer!

    209 引用 • 72 回帖
  • Ant-Design

    Ant Design 是服务于企业级产品的设计体系,基于确定和自然的设计价值观上的模块化解决方案,让设计者和开发者专注于更好的用户体验。

    17 引用 • 23 回帖 • 3 关注
  • 运维

    互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。

    148 引用 • 257 回帖
  • Openfire

    Openfire 是开源的、基于可拓展通讯和表示协议 (XMPP)、采用 Java 编程语言开发的实时协作服务器。Openfire 的效率很高,单台服务器可支持上万并发用户。

    6 引用 • 7 回帖 • 94 关注