repair:

bigbrother666sh · bigbrother666sh · commit 7af17bf6a502 · 2025-07-30T17:11:53.000+08:00
1. nodriver helper- user_data_dir, can work on win11 win10 macos ubuntu;
2. user can specify the chrome install path by environment BROWSER_EXECUTABLE_PATH
diff --git a/core/async_logger.py b/core/async_logger.py
@@ -3,7 +3,10 @@
 import sys, traceback
 
 
-base_directory = os.path.join(".", os.getenv("PROJECT_DIR", "work_dir"))
+# 获取脚本所在目录的父目录作为项目根目录
+_current_file_dir = os.path.dirname(os.path.abspath(__file__))
+_project_root = os.path.dirname(_current_file_dir)  # 回到项目根目录
+base_directory = os.path.join(_project_root, os.getenv("PROJECT_DIR", "work_dir"))
 os.makedirs(base_directory, exist_ok=True)
 wis_logger = get_logger(base_directory, "wiseflow_info_scraper")
 
diff --git a/core/wis/nodriver_helper.py b/core/wis/nodriver_helper.py
@@ -1,7 +1,7 @@
 from __future__ import annotations
 import asyncio
 import json
-# from typing import Callable, Dict, Any, List, Union
+import os
 from typing import Optional
 import nodriver as uc
 from pathlib import Path
@@ -42,17 +42,13 @@ async def start(self):
         """启动浏览器"""
         # 设置浏览器配置
         config = {
-            'user_data_dir': str(self.browser_data),  # 使用单一的浏览器数据目录
+            'user_data_dir': self.browser_data,  # 使用单一的浏览器数据目录
             'headless': False,
-            'browser_args': [
-                '--lang=zh-CN',
-                # '--no-sandbox',
-                '--disable-translate',  # 禁用翻译
-                '--no-first-run',  # 禁用首次运行向导
-                '--no-default-browser-check'
-            ]
+            'lang': 'zh-CN',
         }
-        
+        if os.environ.get('BROWSER_EXECUTABLE_PATH'):
+            config['browser_executable_path'] = os.environ.get('BROWSER_EXECUTABLE_PATH')
+
         self.browser = await uc.start(**config)
 
     async def open_page(self, url: str = None):
diff --git a/test/mc_fetching_test.py b/test/mc_fetching_test.py
@@ -6,9 +6,9 @@
 import sys
 from datetime import datetime
 
-root_path = os.path.join(os.path.dirname(os.path.abspath(__file__)), '..')
+root_path = os.path.join(os.path.dirname(os.path.abspath(__file__)), '..', 'core')
 sys.path.append(root_path)
-from core.wis import KuaiShouCrawler, WeiboCrawler, WeiboSearchType, WEIBO_PLATFORM_NAME, KUAISHOU_PLATFORM_NAME
+from wis import KuaiShouCrawler, WeiboCrawler, WeiboSearchType, WEIBO_PLATFORM_NAME, KUAISHOU_PLATFORM_NAME
 
 
 save_dir = os.path.join(os.path.dirname(os.path.abspath(__file__)), 'webpage_samples')
@@ -28,7 +28,7 @@ async def main(keywords: list,
     except Exception as e:
         print(e)
         return
-    albums, posts = await crawler.posts_list(keywords=keywords, creator_ids=creator_ids, existings=existings, limit_hours=limit_hours, search_type=search_type)
+    albums, posts = await crawler.posts_list(keywords=keywords, creator_ids=creator_ids, existings=existings)
     print(albums)
     time_stamp = datetime.now().strftime('%Y-%m-%d-%H-%M-%S')
     albums_json = {
@@ -46,10 +46,10 @@ async def main(keywords: list,
         print("\n--- No posts found in posts to select from ---")
         return
     
-    article, ref = await crawler.post_as_article(selected_post)
+    article, ref = await crawler.as_article(selected_post)
     print(article)
     print(ref)
-    creator_info = await crawler.creator_as_article(selected_post.get("user_id"))
+    creator_info = await crawler.as_creator(selected_post.get("user_id"))
     print(creator_info)
     article_json = {
         "article": article,