Python中如何抓取某团网美食店铺信息

某团网的美食店铺信息主要通过接口获取，而接口最重要的参数就是 _token，其主要是通过对接口相应参数的二进制加密和 Base64 编码处理后得到，做一次 base64 解码、二进制解压即可清楚其中的加密原理（ sign 参数相同）。所以，只需要伪装_token 参数，携带请求接口就可以拿到数据。

另外，为提高爬取效率，实现了多进程，裸 IP 多进程访问会返回验证页，测试可用真机 IP。

项目已提交 github, 欢迎提交 issue，pull requests 等。地址： https://github.com/Northxw/Meituan

PS：断断续续写了好几天，比较佛系，如有冗余之处或不足之处还请见谅。

yuanlaile 1楼

怎么使用的没看懂这个求具体使用教程

yibo5220 2楼

要抓取美团的美食店铺信息，可以使用requests和BeautifulSoup。首先，你得分析美团网页的请求，找到数据接口。通常，这类网站的数据是通过XHR请求加载的，直接解析HTML可能拿不到完整信息。

下面是一个基础示例，展示了如何通过模拟请求来获取数据。你需要先找到实际的API接口和必要的请求头（比如User-Agent、Cookie等）。这里假设接口是https://api.meituan.com/...，但实际地址需要你自己用浏览器的开发者工具（Network标签）查找。

import requests
import json

# 定义请求头，模仿浏览器访问
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36',
    'Referer': 'https://www.meituan.com/',
    # 可能需要添加Cookie，这里用占位符
    'Cookie': 'your_cookie_here'
}

# 假设的API URL，参数包括位置、页码等
url = 'https://api.meituan.com/xxx/v1/poi/search'
params = {
    'cityId': 1,  # 城市ID
    'q': '美食',
    'page': 1,
    'pageSize': 20
}

try:
    response = requests.get(url, headers=headers, params=params)
    response.raise_for_status()  # 检查请求是否成功
    data = response.json()
    
    # 解析数据，这里假设返回的JSON中有'data'字段，里面是店铺列表
    shops = data.get('data', [])
    for shop in shops:
        name = shop.get('name', 'N/A')
        address = shop.get('address', 'N/A')
        avg_price = shop.get('avgPrice', 'N/A')
        print(f"店名: {name}, 地址: {address}, 人均: {avg_price}")
except requests.exceptions.RequestException as e:
    print(f"请求出错: {e}")
except json.JSONDecodeError as e:
    print(f"JSON解析出错: {e}")

关键点：