爬取猎取网药品说明书

写个小小爬虫,爬取猎取网的药品说明书,大概是一万条数据 import requests import codecs from lxml import html headers={ 'Host':'www.liequ.net', 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36' } for i in range(1,9445): url='https://www.liequ.net/yaopin/{}.html'.format(i) r=requests.get(url,...
Click to read more ...

利用高德和百度获取经纬度和地址

两个小程序 #-*- coding: utf8 -*- #!usr/bin/env python3 # encoding: utf-8 # Filename:amap_api.py import xlrd import requests import time import sys amap_key = '00b7eb4446f0f4e47a268de7feee37a0' city_search = '全国' # 限制搜索区域 默认需要填写"全国",且city_limit为"false" city_limit = 'false' # 'true'代表需要限制,'false'代表不限制 file_input = "amap_input.xlsx" # 输入文件的文件名 t...
Click to read more ...

爬取药监局药品名录

写个小爬虫,爬取国家药监局的器材名录。大概爬取了13万条信息 # -*- coding:utf-8 -*- from lxml import html import requests proxies = { "https": "219.138.58.13:3128", } for i in range(1,135999): url='http://db.pharmcube.com/database/cfda/detail/cfda_cn_instrument/' url1=url+str(i) print(i) try: r1=requests.get(url1,proxies=proxi...
Click to read more ...

获取图吧地图终端信息

#!usr/bin/env python3 # Filename:shenzhen_pharm_analysis.py #http://poi.mapbar.com/shenzhen/D20/ import sys import random import requests import time import xlrd import telnetlib from lxml import html directory_path = sys.path[0] # 当前文件夹路径 time0 = time.strftime('%Y%m%d%H%M%S', time.localtime(time.time())) # 当前时间 print("当前操作文件夹:" + directo...
Click to read more ...

markdow语法

刚刚建立博客,学习一下markdown语法 简介 Markdown 是一种轻量级标记语言,它用简洁的语法代替排版,使我们专心于码字。它的目标是实现易读易写,成为一种适用于网络的书写语言。同时,Markdown支持嵌入html标签。 注意:Markdown使用#、+、*等符号来标记, 符号后面必须跟上 至少1个 空格才有效! Markdown的常用语法 标题 Markdown 标题支持两种形式: 1、用#标记 在 标题开头 加上1~6个#,依次代表一级标题、二级标题….六级标题 一级标题 二级标题 三级标题 四级标题 五级标题 六级标题 2、用=和-标记 在 标题底下 加上任意个=代表一级标题,-代表二级标题 一级标题 二级标题 效果如下: 一级标题 二级标题 ...
Click to read more ...