前言 “今天她又发新笔记了吗?”
相信很多同学都有过这样的经历。作为一名资深舔狗,一直秉承着 “舔得狗中狗,方为人上人” 的原则,必须 24 小时待命,不能错过女神的任何动态,但同时作为一名资深软件工程师,与其整天盯着手机刷新,不如用技术来解决这个问题! 今天,我们就来构建一个专属得“女神小红书动态监控系统”,让你永远不错过她的每一条动态,永远第一时间向她嘘寒问暖,做她最忠实的粉丝(舔狗)!
需求分析 作为一名合格的舔狗,我们需要:
提升你的 Python 编程能力
技术方案 为了实现这个浪漫的需求,我们需要:
使用 Python + xhs 库获取女神的最新笔记
使用 SQLite 存储笔记历史数据
创建项目 首先让我们创建一个新的项目目录并进入该目录,然后创建一个虚拟环境,并安装所需的依赖库。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 mkdir xhs-monitorcd xhs-monitorpython -m venv venv source venv/bin/activatevenv\Scripts\activate pip install requests xhs playwright sqlite3
核心代码实现 实现配置模块 创建 config.py 文件, 用来配置小红书,企业微信通知以及监控相关的可配置信息。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 XHS_CONFIG = { "COOKIE" : "你的小红书Cookie" , } WECOM_CONFIG = { "CORPID" : "你的企业ID" , "AGENTID" : 你的应用ID, "SECRET" : "你的应用Secret" , } MONITOR_CONFIG = { "USER_ID" : "女神的用户ID" , "CHECK_INTERVAL" : 5 , "ERROR_COUNT" : 10 , }
实现企业微信通知模块 创建 wecom.py 文件, 用来实现企业微信通知功能。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 import timeimport requestsclass WecomMessage : def __init__ (self, corpid: str , agentid: int , secret: str ): """ 初始化企业微信消息发送类 :param corpid: 企业ID :param agentid: 应用ID :param secret: 应用的Secret """ self .corpid = corpid self .agentid = agentid self .secret = secret self .access_token = None self .token_expires_time = 0 def get_access_token (self ) -> str : """ 获取访问令牌 :return: access_token """ now = time.time() if self .access_token and now < self .token_expires_time: return self .access_token url = "https://qyapi.weixin.qq.com/cgi-bin/gettoken" params = { "corpid" : self .corpid, "corpsecret" : self .secret } try : response = requests.get(url, params=params) data = response.json() if data.get("errcode" ) == 0 : self .access_token = data.get("access_token" ) self .token_expires_time = now + data.get("expires_in" ) - 200 return self .access_token else : raise Exception(f"获取access_token失败: {data} " ) except Exception as e: print (f"获取access_token异常: {e} " ) raise def send_text (self, content: str , touser: str = "@all" ) -> bool : """ 发送文本消息 :param content: 消息内容 :param touser: 接收人,默认为所有人 :return: 是否发送成功 """ try : message = { "touser" : touser, "msgtype" : "text" , "agentid" : self .agentid, "text" : { "content" : content }, "enable_duplicate_check" : 1 , "duplicate_check_interval" : 1800 } access_token = self .get_access_token() url = f"https://qyapi.weixin.qq.com/cgi-bin/message/send?access_token={access_token} " response = requests.post(url, json=message) result = response.json() if result.get("errcode" ) == 0 : print (f"企业微信消息发送成功" ) return True else : print (f"企业微信消息发送失败: {result} " ) return False except Exception as e: print (f"企业微信消息发送异常: {e} " ) return False
我们创建一个 WecomMessage
类, 用来实现企业微信通知功能。
根据企业微信相关文档(https://developer.work.weixin.qq.com/document/path/90236) , 我们使用企业微信的 message API 来发送应用消息实现通知。这需要一些企业微信的配置信息, 包括企业ID, 应用ID, 应用Secret。我们通过配置模块存放这些信息,并将这些信息作为 WecomMessage
类的 __init__
发送应用消息需要获取访问令牌(access_token), 我们通过 get_access_token
最后,我们通过 send_text
实现数据库模块 创建 db.py 文件, 用来实现数据库相关功能。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 import sqlite3from datetime import datetimefrom typing import List class Database : def __init__ (self, db_path: str = "notes.db" ): """ 初始化数据库连接 :param db_path: 数据库文件路径 """ self .db_path = db_path self .init_db() def init_db (self ): """ 初始化数据库表 """ with sqlite3.connect(self .db_path) as conn: cursor = conn.cursor() cursor.execute(''' CREATE TABLE IF NOT EXISTS notes ( note_id TEXT PRIMARY KEY, user_id TEXT NOT NULL, title TEXT, discovered_time TEXT NOT NULL, type TEXT ) ''' ) conn.commit() def add_note_if_not_exists (self, note_data: dict ) -> bool : """ 添加笔记记录 :param note_data: 笔记数据 :return: 是否为新笔记 """ with sqlite3.connect(self .db_path) as conn: cursor = conn.cursor() cursor.execute('SELECT note_id FROM notes WHERE note_id = ?' , (note_data.get('note_id' ),)) if cursor.fetchone(): return False cursor.execute(''' INSERT INTO notes ( note_id, user_id, title, discovered_time, type ) VALUES (?, ?, ?, ?, ?) ''' , ( note_data.get('note_id' ), note_data.get('user' ).get('user_id' ), note_data.get('display_title' , '无标题' ), datetime.now().strftime('%Y-%m-%d %H:%M:%S' ), note_data.get('type' , 'normal' ) )) conn.commit() return True
我们创建一个 Database
类, 用来实现数据库相关功能。
通过 init_db
方法来初始化数据库表, 如果 notes 数据库表不存在, 则创建它。
通过 add_note_if_not_exists
方法来添加笔记记录。如果笔记已存在, 则返回 False, 否则将笔记插入到数据库表并返回 True
由于该监控系统主要是监控用户是否有新笔记,对笔记的具体内容并不是很关心, 所以这里我们只保存笔记的 id, 用户 id, 标题, 发现时间以及笔记类型。
实现工具模块 创建 utils.py 文件, 用来实现程序所需的工具函数。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 from playwright.sync_api import sync_playwrightfrom time import sleepdef xhs_sign (uri, data=None , a1="" , web_session="" ): for _ in range (10 ): try : with sync_playwright() as playwright: stealth_js_path = "public/stealth.min.js" chromium = playwright.chromium browser = chromium.launch(headless=True ) browser_context = browser.new_context() browser_context.add_init_script(path=stealth_js_path) context_page = browser_context.new_page() context_page.goto("https://www.xiaohongshu.com" ) browser_context.add_cookies([ {'name' : 'a1' , 'value' : a1, 'domain' : ".xiaohongshu.com" , 'path' : "/" }] ) context_page.reload() sleep(1 ) encrypt_params = context_page.evaluate("([url, data]) => window._webmsxyw(url, data)" , [uri, data]) return { "x-s" : encrypt_params["X-s" ], "x-t" : str (encrypt_params["X-t" ]) } except Exception: pass raise Exception("重试了这么多次还是无法签名成功,寄寄寄" )
这里我们实现了一个 xhs_sign
该方法通过 playwright 库来模拟浏览器行为,获取小红书请求的签名,并返回签名信息。而不是直接逆向小红书请求的签名算法,因为小红书请求的签名算法可能会随时更新,导致我们之前逆向的代码失效。
如果签名获取失败,则抛出异常,并重试 10 次。
实现监控主程序 创建 monitor.py 文件, 用来实现监控主程序。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 from xhs import XhsClientimport timefrom typing import List from config import XHS_CONFIG, WECOM_CONFIG, MONITOR_CONFIGfrom utils import xhs_signfrom db import Databasefrom wecom import WecomMessageclass XHSMonitor : def __init__ (self, cookie: str , corpid: str , agentid: int , secret: str ): """ 初始化监控类 :param cookie: 小红书cookie :param corpid: 企业ID :param agentid: 应用ID :param secret: 应用的Secret """ self .client = XhsClient(cookie=cookie, sign=xhs_sign) self .wecom = WecomMessage(corpid, agentid, secret) self .db = Database() self .error_count = 0 def send_error_notification (self, error_msg: str ): """ 发送错误通知 :param error_msg: 错误信息 """ time_str = time.strftime('%Y-%m-%d %H:%M:%S' ) content = ( "小红书监控异常告警\n" f"错误信息:{error_msg} \n" f"告警时间:{time_str} " ) self .wecom.send_text(content) def get_latest_notes (self, user_id: str ) -> List [dict ]: """ 获取用户最新笔记 :param user_id: 用户ID :return: 笔记列表 """ try : res_data = self .client.get_user_notes(user_id) self .error_count = 0 return res_data.get('notes' , []) except Exception as e: error_msg = str (e) print (f"获取用户笔记失败: {error_msg} " ) time.sleep(60 ) self .error_count += 1 if self .error_count >= MONITOR_CONFIG["ERROR_COUNT" ]: self .send_error_notification(f"API 请求失败\n详细信息:{error_msg} " ) exit(-1 ) return [] def send_note_notification (self, note_data: dict ): """ 发送笔记通知 :param note_data: 笔记数据 """ note_url = f"https://www.xiaohongshu.com/explore/{note_data.get('note_id' )} " user_name = note_data.get('user' , {}).get('nickname' , '未知用户' ) title = note_data.get('display_title' , '无标题' ) type = note_data.get('type' , '未知类型' ) time_str = time.strftime('%Y-%m-%d %H:%M:%S' ) content = ( "小红书用户发布新笔记\n" f"用户:{user_name} \n" f"标题:{title} \n" f"链接:{note_url} \n" f"类型:{type } \n" f"监控时间:{time_str} " ) self .wecom.send_text(content) def monitor_user (self, user_id: str , interval: int ): """ 监控用户动态 :param user_id: 用户ID :param interval: 检查间隔(秒) """ print (f"开始监控用户: {user_id} " ) while True : try : latest_notes = self .get_latest_notes(user_id) for note in latest_notes: if self .db.add_note_if_not_exists(note): print (f"发现新笔记: {note.get('display_title' )} " ) self .send_note_notification(note) except Exception as e: error_msg = str (e) print (f"监控过程发生错误: {error_msg} " ) time.sleep(interval) def main (): monitor = XHSMonitor( cookie=XHS_CONFIG["COOKIE" ], corpid=WECOM_CONFIG["CORPID" ], agentid=WECOM_CONFIG["AGENTID" ], secret=WECOM_CONFIG["SECRET" ] ) monitor.monitor_user( user_id=MONITOR_CONFIG["USER_ID" ], interval=MONITOR_CONFIG["CHECK_INTERVAL" ] ) if __name__ == "__main__" : main()
首先我们定义一个 main
函数中我们通过 XHSMonitor
类来初始化监控对象,并传入配置模块中的小红书 cookie, 企业微信配置信息以及监控配置信息。
然后我们通过 monitor_user
类中我们一共需要实现 5 个方法, 分别是:
XHSMonitor 类详解 __init__
方法用来初始化监控对象的属性, 我们需要在这个方法中初始化 xhsClient
对象, wecomMessage
对象以及 database
对象,并赋值给监控对象对应的属性。同时,我们还需要初始化一个错误计数器,用来记录 API 请求失败的次数。 其中在初始化 xhsClient
对象时,我们传入了 cookie 和 sign 参数。cookie 是我们在配置模块中配置的小红书 cookie,sign 则是我们在 utils 模块中实现的 xhs_sign
方法, 用来生成小红书请求的签名。
方法的主要功能是获取女神的最新笔记。内部通过 XhsClient
的 get_user_notes
方法来获取小红书用户笔记。如果获取失败,则将错误信息记录到错误计数器中,如果错误计数器达到最大重试次数,则调用 send_error_notification
方法发送错误通知并退出程序。当然,如果获取成功,则将错误计数器清零。由于大多数错误是触发了小红书的反爬虫机制,所以这里我们也会通过 sleep
方法的主要功能是发送错误通知到企业微信。核心逻辑也很简单,就是将错误信息和当前时间拼接成一条文本消息,然后调用 WecomMessage
的 send_text
方法用来监控女神的最新笔记。通过 while 循环不断调用 get_latest_notes
方法获取女神的最新笔记,然后通过 add_note_if_not_exists
方法判断笔记是否已存在,如果笔记不存在,则说明是新笔记,则调用 send_note_notification
方法和 send_error_notification
类似。将笔记的标题, 链接, 类型, 监控时间以及用户名拼接成一条文本消息,然后调用 WecomMessage
的 send_text
运行监控程序 以上,我们的核心代码已经实现完毕,接下来我们就可以运行我们的监控程序,测试程序是否正常,行为是否符合预期。
在正式运行之前,我们需要先配置好小红书 cookie, 企业微信配置信息以及监控配置信息。
获取小红书 cookie 我们登录小红书 Web 端,打开开发者工具,在 Network 标签下找到请求头中包含 Cookie(a1, web_session 和 webId)的请求,复制请求头中的 Cookie 信息,然后粘贴到配置模块中的 XHS_CONFIG 中。
获取企业微信配置信息 登录企业微信后台,创建一个企业或者加入一个企业,获取企业的 CORPID,然后在应用管理中创建一个应用,获取应用的 AGENTID 和 SECRET,然后粘贴到配置模块中的 WECOM_CONFIG 中。
获取女神小红书用户 ID 通过小红书 Web 端,访问女神的笔记主页,浏览器地址栏 /user/profile/xxx 中的 xxx 就是小红书用户 ID。
本地运行 当完成以上配置后,本地运行很简单,只需要在终端中执行以下命令即可:
当终端输出 “开始监控用户: xxxxxxx” 时,说明监控程序已经启动成功,女神发布新笔记时,我们就会收到通知了。(注意:第一次启动时,由于数据库中没有数据,所以会发送很多通知,不用担心,这些通知都是女神之前的笔记,我们只需要持续运行监控,关注新笔记即可)
部署到云服务器 部署到云服务器,可以保证监控程序的持久运行。我们使用 screen 保持程序在后台持续运行。
1 2 3 4 screen -S xhs_monitor python monitor.py
结语 通过这篇教程,我们实现了一个女神小红书动态监控系统,让我们永远不错过她的每一条动态,永远第一时间向她嘘寒问暖,做她最忠实的粉丝(舔狗)! 但是,技术只是手段,真正的爱情需要我们用心去经营,希望各位同学都能追到自己的女神,并和她一起走向幸福的未来!
项目地址 https://github.com/beilunyang/xhs-monitor