HTTP access

Web page にアクセスしようと思えば、一応 TCP 接続で Web server の http ポート(標準: 80)にアクセスすれば、一応お話できます。 でも、HTTP protocol を理解してないといけません(「http telnet」などで検索すると、感じが分かってもらえるかと)。 https のサイトにアクセスするなら TLS の使い方(handshake や公開鍵認証の仕方)も分かっていないといけません。 そんなの、各自がプログラムに書いていたら大変です。

Python の標準ライブラリにはurllibというのがあるのですが、 もう少し気楽に text を扱える Requests というHTTPライブラリがあるので、そちらの例を紹介しておきます。簡単な使い方はquickstartのページを見てください。

それと、標準ライブラリ以外を使うので、pip を用いてライブラリ登録をしないといけないです。各環境に合わせた操作をおこなってください。

  • PyCharm では、プロジェクト直下の requirements.txt を表示すると、不足しているパッケージがインストールできる。
  • VS Code では、terminal で、python -m pip install --user -r requirements.txt を実行すると、同じく不足パッケージのインストールが可能です。

url_access.py

def url_access():
    url_string = "https://www.nc.ii.konan-u.ac.jp/projects/cloudSysPractice/"
    response = requests.get(url_string)  # URL アクセス、結果(response)を取得。
    response.encoding = response.apparent_encoding  # 文字コード設定
    print(response.text)