Skip to content
This repository was archived by the owner on Feb 15, 2023. It is now read-only.

Commit f9be443

Browse files
committed
Úprava URLs pro webscraping.
1 parent f62777b commit f9be443

File tree

2 files changed

+3
-3
lines changed

2 files changed

+3
-3
lines changed

datova-analyza/webscraping/excs/scraping-dhmo.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -3,7 +3,7 @@ title: Scraping DHMO
33
demand: 3
44
---
55

6-
Napište program, který bude pracovat se stránkou o DHMO na adrese http://scrape.kodim.cz/dhmo/index.
6+
Napište program, který bude pracovat se stránkou o DHMO na adrese `https://apps.kodim.cz/python-data/dhmo`.
77

88
1. Nechť program vypíše na výstup nadpisy všech sekcí (značka `h2`).
99
1. Nechť program vypíše na výstup cesty všech odkazů na stránce (značka `a`, atribut `href`).

datova-analyza/webscraping/lesson.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -150,14 +150,14 @@ html.find('ol[type="a"] li')
150150
151151
## Scraping přes internet
152152
153-
Zatím jsme scrapovali pouze stránku, kterou jsme měli uloženou na disku. Pomocí modulu `requests-html` můžeme však také snadno otevřít stránku přímo na internetu. Na adrese <http://scrape.kodim.cz/sample/index> najdete naši malou ukázkovou stránku z úvodu. Na adrese <http://scrape.kodim.cz/dhmo/index> najdete také finální verzi stránky šířící poplach ohledně DHMO.
153+
Zatím jsme scrapovali pouze stránku, kterou jsme měli uloženou na disku. Pomocí modulu `requests-html` můžeme však také snadno otevřít stránku přímo na internetu. Na adrese <https://apps.kodim.cz/python-data/scrape> najdete naši malou ukázkovou stránku z úvodu. Na adrese <https://apps.kodim.cz/python-data/dhmo> najdete také finální verzi stránky šířící poplach ohledně DHMO.
154154
155155
Načteme v Pythonu první z odkazů a stejně jako prve vypíšeme texty všech odstavců.
156156
157157
```py
158158
from requests_html import HTMLSession
159159
session = HTMLSession()
160-
stranka = session.get('http://scrape.kodim.cz/sample/index')
160+
stranka = session.get('https://apps.kodim.cz/python-data/sample')
161161
for odstavec in stranka.html.find('p'):
162162
print(odstavec.text)
163163
```

0 commit comments

Comments
 (0)