拉取最新县及县以上行政区划代码

本贴最后更新于 1913 天前,其中的信息可能已经渤澥桑田

最新县及县以上行政区划代码(截止 2016 年 7 月 31 日)

url:http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201703/t20170310_1471429.html(网站 404)

更多数据

可以通过 UNPKG 下载使用 CDN 资源: https://unpkg.com/province-city-china/dist/

文件列表 JSON CSV SQL CDN
总数据(省/地/县/乡) data.json data.csv data.sql data.sql / csv / json
省/地/县/乡层级数据 level.json - - level.json
省级(省/直辖市/特别行政区) province.json province.csv - province.json / csv
地级(城市) city.json city.csv - city.json / csv
县级(区县) area.json area.csv - area.json / csv
乡级(乡镇/街) town.json town.csv - town.json / csv
县市区没有乡级数据

参考代码:http://www.thinksaas.cn/topics/0/353/353549.html
工具:jsoup

import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.SQLException; import java.util.ArrayList; import java.util.HashMap; import java.util.List; import java.util.Map; import java.util.logging.Level; import java.util.logging.Logger; import org.apache.commons.lang3.StringUtils; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class getpcd { /** * All rights Reserved, Designed By www.vps6.win * @Title: getpcd.java * @Package * @Description: TODO(用一句话描述该文件做什么) * @author: liuchao * @date: 2017年4月27日 下午10:52:40 * @version V1.0 * @Copyright: 2017 www.vps6.win Inc. All rights reserved. * */ private static final Logger log = Logger.getLogger("xzqhdm"); private static final String separator = "#"; public static void main(String[] args) throws Exception { List<String> list = getData(); for(String s : list){ System.out.println(s); } saveData(list); } private static List<String> getData() throws Exception { List<String> retList = new ArrayList<String>(); Map<String,String> map = new HashMap<String,String>(); Document doc = Jsoup.connect("http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201703/t20170310_1471429.html").post(); Elements ps = doc.select(".TRS_PreAppend p"); for (Element e : ps) { Elements spans = e.select("span"); Element firstE = null; Element secondE = null;; if(spans.size() == 3){ //一级 firstE = spans.first(); secondE = spans.get(2); }else{ //二级/三级 firstE = spans.get(1); secondE = spans.get(3); } String key = StringUtils.trim(firstE.ownText()); map.put(key, key+separator+StringUtils.trim(secondE.ownText().replace(" ", ""))+ separator + key.substring(0, 4)+"00"+separator+"3"); if (key.endsWith("0000")) { map.put(key, key+separator+StringUtils.trim(secondE.ownText().replace(" ", ""))+ separator+"0"+separator+"1"); //key = key.substring(0, 2); } else if (key.endsWith("00")) { map.put(key, key+separator+StringUtils.trim(secondE.ownText().replace(" ", ""))+ separator+key.substring(0, 2)+"0000"+separator+"2"); //key = key.substring(0, 4); } if(map.get(key) == null){ System.out.println(key); } retList.add(map.get(key)); } return retList; } private static void saveData(List<String> list) { Connection conn = null; PreparedStatement pstmt = null; try { Class.forName("com.mysql.jdbc.Driver"); conn = DriverManager.getConnection( "jdbc:mysql://localhost/test?characterEncoding=utf8&zeroDateTimeBehavior=convertToNull", "root", "root"); conn.setAutoCommit(false);// 事务不自动提交 pstmt = conn.prepareStatement("delete from code"); int count = pstmt.executeUpdate(); log.log(Level.INFO, "___删除数据" + count); int batch = 500;// 一次插入多少笔 int loop = list.size() / batch;// batch可以循环的次数 int last = list.size() - batch * loop;// 最后剩余 int start = 0;// list从哪开始取数据 int index = 1;// 问号参数 int allCount = 0;// 统计总共插入多少数据 for (int i = 0; i < loop; i++) { index = 1;// 重置到第一个问号参数 pstmt = conn.prepareStatement(getPreSql(batch)); for (int j = start; j < start + batch; j++) { String[] s = list.get(j).split(separator); for (int k = 0; k < s.length; k++) { pstmt.setString(index, s[k]); index++; } } count = pstmt.executeUpdate(); allCount += count; log.log(Level.INFO, "___插入数据" + count); start += batch; } if (last > 0) { index = 1;// 重置到第一个问号参数 pstmt = conn.prepareStatement(getPreSql(last)); for (int j = start; j < list.size(); j++) { String[] s = list.get(j).split(separator); for (int k = 0; k < s.length; k++) { pstmt.setString(index, s[k]); index++; } } count = pstmt.executeUpdate(); allCount += count; log.log(Level.INFO, "___插入数据" + count); } log.log(Level.INFO, "___一共插入" + allCount); conn.commit();// 提交事务 conn.setAutoCommit(true);// 还原现场 } catch (ClassNotFoundException e) { log.log(Level.SEVERE, "___找不到MySQL驱动包" + e.getMessage()); e.printStackTrace(); } catch (Exception e) { log.log(Level.SEVERE, "___执行SQL异常" + e.getMessage()); e.printStackTrace(); try { if (conn != null) { conn.rollback(); conn.setAutoCommit(true);// 还原现场 log.log(Level.WARNING, "___回滚数据"); } } catch (SQLException e1) { log.log(Level.SEVERE, "___回滚异常" + e.getMessage()); e1.printStackTrace(); } } finally { try { if (pstmt != null) { pstmt.close(); } if (conn != null) { conn.close(); } } catch (SQLException e) { log.log(Level.SEVERE, "___关闭数据库连接异常" + e.getMessage()); e.printStackTrace(); } } } /** * 生成sql * * @return */ private static String getPreSql(int count) { StringBuilder sb = new StringBuilder(); sb.append("INSERT INTO `code` (`code`, `name`,`pcode`,`type`) VALUES"); for (int i = 0; i < count; i++) { sb.append("(?, ?, ?, ?),"); } return sb.substring(0, sb.length() - 1); } }
  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3194 引用 • 8214 回帖
  • JSONP
    4 引用 • 11 回帖
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    693 引用 • 537 回帖
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖 • 1 关注
1 操作
alanfans 在 2019-12-31 15:32:46 更新了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • Java 在做这类事情上 还是感觉代码好多 哈哈

    1 回复
  • lijp

    我上周六刚好用 js 谢了一段代码,也是访问统计局的这个页面。
    js 不太会写,写的比较 low。

  • lijp
  • lijp

    //

  • lijp

    评论提交 js 有问题啊!!!
    3cc917fa0bde473aafaf7d10db7ae9c7.png

    我认为这段 js 不好的地方是,我人为的给原 html 替换添加了两个样式名称,一个是 class='city'另一个是 class='county'

    9da73c136cd4480792b0294e0a1dedee.png

    1 回复
  • alanfans via A3010
    作者

    啥错?

    1 回复
  • lijp

    评论框里,不能直接输入 js 代码,应该是屏蔽了。

    1 回复
  • 88250

    代码的话用 ``` 包裹起来就行了

请输入回帖内容 ...

推荐标签 标签

  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 81 关注
  • 服务器

    服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。

    125 引用 • 585 回帖 • 1 关注
  • BAE

    百度应用引擎(Baidu App Engine)提供了 PHP、Java、Python 的执行环境,以及云存储、消息服务、云数据库等全面的云服务。它可以让开发者实现自动地部署和管理应用,并且提供动态扩容和负载均衡的运行环境,让开发者不用考虑高成本的运维工作,只需专注于业务逻辑,大大降低了开发者学习和迁移的成本。

    19 引用 • 75 回帖 • 663 关注
  • V2Ray
    1 引用 • 15 回帖 • 1 关注
  • RYMCU

    RYMCU 致力于打造一个即严谨又活泼、专业又不失有趣,为数百万人服务的开源嵌入式知识学习交流平台。

    4 引用 • 6 回帖 • 53 关注
  • OneNote
    1 引用 • 3 回帖
  • 知乎

    知乎是网络问答社区,连接各行各业的用户。用户分享着彼此的知识、经验和见解,为中文互联网源源不断地提供多种多样的信息。

    10 引用 • 66 回帖
  • C

    C 语言是一门通用计算机编程语言,应用广泛。C 语言的设计目标是提供一种能以简易的方式编译、处理低级存储器、产生少量的机器码以及不需要任何运行环境支持便能运行的编程语言。

    85 引用 • 165 回帖 • 1 关注
  • Windows

    Microsoft Windows 是美国微软公司研发的一套操作系统,它问世于 1985 年,起初仅仅是 Microsoft-DOS 模拟环境,后续的系统版本由于微软不断的更新升级,不但易用,也慢慢的成为家家户户人们最喜爱的操作系统。

    226 引用 • 476 回帖
  • 分享

    有什么新发现就分享给大家吧!

    247 引用 • 1794 回帖
  • 负能量

    上帝为你关上了一扇门,然后就去睡觉了....努力不一定能成功,但不努力一定很轻松 (° ー °〃)

    88 引用 • 1235 回帖 • 413 关注
  • Access
    1 引用 • 3 回帖 • 6 关注
  • 代码片段

    代码片段分为 CSS 与 JS 两种代码,添加在 [设置 - 外观 - 代码片段] 中,这些代码会在思源笔记加载时自动执行,用于改善笔记的样式或功能。

    用户在该标签下分享代码片段时需在帖子标题前添加 [css] [js] 用于区分代码片段类型。

    133 引用 • 884 回帖
  • 小说

    小说是以刻画人物形象为中心,通过完整的故事情节和环境描写来反映社会生活的文学体裁。

    31 引用 • 108 回帖
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    6 引用 • 26 回帖 • 547 关注
  • Chrome

    Chrome 又称 Google 浏览器,是一个由谷歌公司开发的网页浏览器。该浏览器是基于其他开源软件所编写,包括 WebKit,目标是提升稳定性、速度和安全性,并创造出简单且有效率的使用者界面。

    62 引用 • 289 回帖 • 1 关注
  • Solo

    Solo 是一款小而美的开源博客系统,专为程序员设计。Solo 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    1440 引用 • 10067 回帖 • 490 关注
  • TextBundle

    TextBundle 文件格式旨在应用程序之间交换 Markdown 或 Fountain 之类的纯文本文件时,提供更无缝的用户体验。

    1 引用 • 2 回帖 • 76 关注
  • OpenResty

    OpenResty 是一个基于 NGINX 与 Lua 的高性能 Web 平台,其内部集成了大量精良的 Lua 库、第三方模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态 Web 应用、Web 服务和动态网关。

    17 引用 • 56 关注
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    108 引用 • 295 回帖
  • Office

    Office 现已更名为 Microsoft 365. Microsoft 365 将高级 Office 应用(如 Word、Excel 和 PowerPoint)与 1 TB 的 OneDrive 云存储空间、高级安全性等结合在一起,可帮助你在任何设备上完成操作。

    5 引用 • 34 回帖
  • 倾城之链
    23 引用 • 66 回帖 • 158 关注
  • 旅游

    希望你我能在旅途中找到人生的下一站。

    93 引用 • 901 回帖
  • Sym

    Sym 是一款用 Java 实现的现代化社区(论坛/BBS/社交网络/博客)系统平台。

    下一代的社区系统,为未来而构建

    524 引用 • 4601 回帖 • 701 关注
  • SVN

    SVN 是 Subversion 的简称,是一个开放源代码的版本控制系统,相较于 RCS、CVS,它采用了分支管理系统,它的设计目标就是取代 CVS。

    29 引用 • 98 回帖 • 690 关注
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    93 引用 • 113 回帖
  • JVM

    JVM(Java Virtual Machine)Java 虚拟机是一个微型操作系统,有自己的硬件构架体系,还有相应的指令系统。能够识别 Java 独特的 .class 文件(字节码),能够将这些文件中的信息读取出来,使得 Java 程序只需要生成 Java 虚拟机上的字节码后就能在不同操作系统平台上进行运行。

    180 引用 • 120 回帖 • 1 关注