Update douyin.py

steven7851 · web-flow · commit 327bb2a920c9 · 2018-08-16T10:16:32.000+08:00
diff --git a/douyin/douyin.py b/douyin/douyin.py
@@ -10,14 +10,15 @@ def __init__(self, width = 500, height = 300):
 		"""
 		抖音App视频下载
 		"""
-		rip = ip_address('.'.join(map(str, (random.randint(0, 255) for _ in range(4)))))
+		rip = ip_address('0.0.0.0')
 		while rip.is_private:
 			rip = ip_address('.'.join(map(str, (random.randint(0, 255) for _ in range(4)))))
 		self.headers = {
 			'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
 			'accept-encoding': 'gzip, deflate, br',
 			'accept-language': 'zh-CN,zh;q=0.9',
-			'cache-control': 'max-age=0',
+			'pragma': 'no-cache',
+			'cache-control': 'no-cache',
 			'upgrade-insecure-requests': '1',
 			'user-agent': 'Mozilla/5.0 (Linux; U; Android 5.1.1; zh-cn; MI 4S Build/LMY47V) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/53.0.2785.146 Mobile Safari/537.36 XiaoMi/MiuiBrowser/9.1.3',
 			'X-Real-IP': str(rip),
@@ -28,7 +29,7 @@ def get_video_urls(self, user_id):
 		"""
 		获得视频播放地址
 		Parameters:
-			user_id：查询的用户ID
+			user_id：查询的用户UID
 		Returns:
 			video_names: 视频名字列表
 			video_urls: 视频链接列表
@@ -37,48 +38,45 @@ def get_video_urls(self, user_id):
 		video_names = []
 		video_urls = []
 		share_urls = []
-		unique_id = ''
-		device_id = str(random.randint(3, 5)) + ''.join(map(str, (random.randint(0, 9) for _ in range(10))))
-		search_url = 'https://api.amemv.com/aweme/v1/discover/search/?cursor=0&keyword={0}&count=10&type=1&retry_type=no_retry&device_id={1}&ac=wifi&channel=xiaomi&aid=1128&app_name=aweme&version_code=162&version_name=1.6.2&device_platform=android&ssmix=a&device_type=MI+5&device_brand=Xiaomi&os_api=24&os_version=7.0&manifest_version_code=162&resolution=1080*1920&dpi=480&update_version_code=1622'.format(user_id, device_id)
-		req = requests.get(search_url, headers=self.headers)
-		html = json.loads(req.text)
-		aweme_count = 32767 # html['user_list'][0]['user_info']['aweme_count']
-		uid = html['user_list'][0]['user_info']['uid']
-		nickname = html['user_list'][0]['user_info']['nickname']
-		unique_id = html['user_list'][0]['user_info']['unique_id']
-		if unique_id != user_id:
-			unique_id = html['user_list'][0]['user_info']['short_id']
-			if unique_id != user_id:
-				print('用户ID可能输入错误或无法搜索到此用户ID')
-				sys.exit()
-		share_user_url = 'https://www.amemv.com/share/user/%s' % uid
+		max_cursor = 0
+		has_more = 1
+		share_user_url = 'https://www.amemv.com/share/user/%s' % user_id
 		share_user = requests.get(share_user_url, headers=self.headers)
-		_dytk_re = re.compile(r"dytk: '(.+)'")
+		_dytk_re = re.compile(r"dytk:\s*'(.+)'")
 		dytk = _dytk_re.search(share_user.text).group(1)
+		_nickname_re = re.compile(r'<p class="nickname">(.+?)<\/p>')
+		nickname = _nickname_re.search(share_user.text).group(1)
 		print('JS签名下载中')
 		urllib.request.urlretrieve('https://github.com/Jack-Cherish/python-spider/blob/master/douyin/fuck-byted-acrawler.js', 'fuck-byted-acrawler.js')
 		try:
-			process = Popen(['node', 'fuck-byted-acrawler.js', str(uid)], stdout=PIPE, stderr=PIPE)
+			process = Popen(['node', 'fuck-byted-acrawler.js', str(user_id)], stdout=PIPE, stderr=PIPE)
 		except (OSError, IOError) as err:
 			print('请先安装 node.js: https://nodejs.org/')
 			sys.exit()
 		sign = process.communicate()[0].decode().strip('\n')
-		user_url = 'https://www.amemv.com/aweme/v1/aweme/post/?user_id=%s&max_cursor=0&count=%s&aid=1128&_signature=%s&dytk=%s' % (uid, aweme_count, sign, dytk)
-		req = requests.get(user_url, headers=self.headers)
-		html = json.loads(req.text)
-		for each in html['aweme_list']:
-			share_desc = each['share_info']['share_desc']
-			if os.name == 'nt':
-				for c in r'\/:*?"<>|':
-					nickname = nickname.replace(c, '').strip()
-					share_desc = share_desc.replace(c, '').strip()
-			share_id = each['aweme_id']
-			if share_desc in ['抖音-原创音乐短视频社区', 'TikTok']:
-				video_names.append(share_id + '.mp4')
-			else:
-				video_names.append(share_id + '-' + share_desc + '.mp4')
-			share_urls.append(each['share_info']['share_url'])
-			video_urls.append(each['video']['play_addr']['url_list'][0])
+		print('解析视频链接中')
+		while has_more != 0:
+			user_url = 'https://www.amemv.com/aweme/v1/aweme/post/?user_id=%s&max_cursor=%s&count=21&aid=1128&_signature=%s&dytk=%s' % (user_id, max_cursor, sign, dytk)
+			print(user_url)
+			req = requests.get(user_url, headers=self.headers)
+			while req.status_code != 200:
+				req = requests.get(user_url, headers=self.headers)
+			html = json.loads(req.text)
+			for each in html['aweme_list']:
+				share_desc = each['share_info']['share_desc']
+				if os.name == 'nt':
+					for c in r'\/:*?"<>|':
+						nickname = nickname.replace(c, '').strip()
+						share_desc = share_desc.replace(c, '').strip()
+				share_id = each['aweme_id']
+				if share_desc in ['抖音-原创音乐短视频社区', 'TikTok']:
+					video_names.append(share_id + '.mp4')
+				else:
+					video_names.append(share_id + '-' + share_desc + '.mp4')
+				share_urls.append(each['share_info']['share_url'])
+				video_urls.append(each['video']['play_addr']['url_list'][0])
+			max_cursor = html['max_cursor']
+			has_more = html['has_more']
 
 		return video_names, video_urls, share_urls, nickname
 
@@ -135,7 +133,7 @@ def run(self):
 			None
 		"""
 		self.hello()
-		user_id = input('请输入ID(例如145651081):')
+		user_id = input('请输入UID(例如60388937600):')
 		watermark_flag = int(input('是否下载带水印的视频(0-否,1-是):'))
 		video_names, video_urls, share_urls, nickname = self.get_video_urls(user_id)
 		if nickname not in os.listdir():