blogdownへの道(4)

ローカル web サイトの作成

  1. blogdown パッケージのインストール
    CRAN と GitHub から、次によりインストールできます。

  2. Hugo のインストール
    blogdown のヘルパー関数を使用します。

  3. 次により、プロジェクトへ新規 web を作成します。
  4. 暫く待つと、多数のファイルが作られ、RStudio の Viewer に次のよう web 画面が表示されます。
    図 4-1 web 画面
  5. (追加:2019/05/27)
    config.toml に、次の設定を確認し、未設定なら追加します。

    • relativeURLs:アドレス参照を相対アドレスにします。これを設定しないと、css や Javascript の参照が絶対アドレスになり、参照が不正になります。
    • publishDir:blogdown::build_site() の出力ディレクトリを設定します(この場合は “docs”)。

    サイトに必要なファイルを全て./docs* 以下に生成するため、次のコマンドを実行します。

今回は、ここで作成されたものをそのままアップロードします!

【前に:blogdownへの道(3)】【次へ:blogdownへの道(5)】

blogdownへの道(3)

R プロジェクトの作成

blogdown を使用するには、空のプロジェクトが必要ですので、新規に作成していきます。

1. RStudio のメニューから「File → New Project」を選択し、表示された “Create Project” の中から、”Version Control” を選択し、次に表示される画面では、バージョンコントローとして Git を選択します。

図 3-1 プロジェクトの作成方法の選択
図 3-2 バージョンコントロールに Git を使用する

2. 次の「Clone Git Repository」画面の”Repository URL” の欄に、先ほど作成しコビーした、Git レポジトリのアドレスを貼り付けます。(図 3-3 参照)
最後に、“Create Project” をクリックします。

図 3-3 新規プロジェクトの作成
<

なお今回は、ディレクトリ “G:\R” の下に、”my_blog” という名前のディレクトリを作成しています。
【前に:blogdownへの道(2)】【次へ:blogdownへの道(4)】

blogdownへの道(2)

GitHubにリボジトリを作る

  1. GitHubにログインします。
  2. 左サイドメニューの “New” ボタンをクリックします。
    図 2-1 リポジトリ作成


  3. “my_blog” と言う名前でリポジトリを作成します。
    図 2-2 名称 my_blog でリポジトリ作成
  4. リポジトリが作成されたので、”https://github.com/アカウント名/レポジトリ名.git” 部分をコピーして、秀丸等に張り付けておきます。
    図 2-3 URLのコピー

GitHubでの作業は、これでいったん終了します。
【前に:blogdownへの道(1)】【次へ:blogdownへの道(3)】

blogdownへの道(1)

参考サイト:RSTUDIOではグラブれないけど、ブログれる

前提条件 R、RStudio、Git がインストール済み
GitHubへのユーザ登録

RStudio で Git を使えるようにする

RStudio をインストールしただけでは Git は使えません。
そのため、参考サイトに示した手順の中に、「RStudioでGitHubレポジトリとリンク」の説明がありますが、この手順が実行できません。
まず、次により Git を有効にする必要があります。

  1. メニューバーから Tools → Global Options を選択
  2. 左側メニューの Git/SVN をクリック
  3. Enable version control interface for RStudio projects をチェックし有効にする
  4. Git executable に git.exe へのパスを入力する
図 1-1 Git の設定
以上で、RStudio 上での Git の使用が可能になっているはずです。

ここで、後に必要になるので Git Bash を立ち上げ、次の Git コマンドを実行しておきます。

【次へ:blogdownへの道(2)】

Anaconda環境へのPycharmインストール

【発生した問題点】

インストールした Anaconda 環境下で Pycharm が動作しない。

【環境】

  1. OS : windows 10
  2. Anaconda3-2018-12(64bit版)
  3. pycharm-community-2018.3.3

【状況の整理】

  1. Pycharm: File->Settings->Project python->Project Interpreter には
    「~/Anaconda3/python.exe」を設定済み
  2. Pycharm アイコンから起動した場合、import した numpy などのパッケージがエラーになる
  3. Anaconda Prompt のコマンドラインから起動すると、この現象が発生せず正常に動作する
  4. idle も同様に、コマンドプロンプトから起動すると import でエラーになるが、Anaconda Prompt から起動した場合はエラーにならない
  5. 【対策】

    「Anaconda Prompt と Command Prompt で動作が異なるのは、Path の設定に違いがあるのでは」との推測のもとに、以下により双方の Path 情報をファイルに出力して比較してみた。

    その結果、Anaconda Prompt 側から得られた Path には、次の 6つが追加されているのが判明した。

    この 6 種のパスを、環境変数の Path に設定し Python を起動したところ問題なく実行できるようになった。
    (なお、Anaconda3\Library\usr\bin と Anaconda3\bin は存在しないので指定不要かと思われる。 )

    パソコンを新しくして、悩み続けた1か月。
    漸く Pycharm が動くようになった。
    目出度し!

R 終了時のワークスペース保存確認を表示しない

R を終了するときに、ワークスペースを “>RData” に保存するかどうかを尋ねられます。
いろいろなサイトを当ってみても、「保存しない」のが一般的なようだ。
しからば、そのダイアログを出さないようにしてしまいましょう。

R Console の場合

R console のショートカット→右クリクック→プロパティ
表示されたプロパティの「リンク先」に、図のように “–no-save” を追加する。

RStudio の場合

RStudio を開き
Menu の “Tools” → “Global Options…” で Options を開き
次の個所を

以下のように変更する。

以上

Jupyter Notebook の初期ディレクトリ

パソコンも windows 10 になり、どうしてもインストールができなかった Anaconda が使えるようになったので jupyter notebook を起動すると、Edge が起動し”C:Users\ユーザ名” が初期ディレクトリとして開かれる。

これを、Chome で初期ディレクトリとして “G:\python” に変更するため

として、
~/.jupyter/jupyter_notebook_config.py
を作成し、以下のように変更。

これで、「スタートメニュー → Anaconda3(64bit) → Jupyter Notebook」
で起動すると、ブラウザは Chrome になったものの、ディレクトリは依然として元のまま変更されない。
これを、コマンドプロンプトから起動すると、指定通り G ドライブに切り替わっている。

これは、起動コマンドの問題だろうと推測できるので、
「スタートメニュー → Anaconda3(64bit) → Jupyter Notebook」を右クリックし、
「その他 → ファイルの場所を開く」
そのフォルダ内の「Jupyter Notebook ショートカット」を
「右クリック → プロパティ」
でプロパティの「リンク先」を見ると

吃驚するほど長いが、環境変数 “%USERPROFILE%/” が怪しいのでググってみると、これが初期ディレクトリを指定しているものらしい。
一応、バックアップのためリンク先をエディタに張り付けた後、リンク先から直接
“%USERPROFILE%/” 部分を削除

これで、 “G:\python” が初期ディレクトリとして開かれるようになりました!

Pythonでスクレイピング

スクレイピングの例として、Yahoo からトヨタの株価を取得しグラフを描いてみる。
逐次確認しながら進めるため、Jupyter-notebookを使用する。

1.Yahoo からトヨタ(7203)の株価を取得する

2.株式のテーブルを取得し、その中の全行(tr)を取出す

結果は、次の様なリストになる。

3.株価データ用の2次元リストを作成する

出力結果の一部を示す

4.plotly で扱いやすくするため、2次元リストをデータフレームに変換する

5.plotly でグラフを描く

本来であれば「ローソク足」という株価特有のチャートにしたかったのだが
plotlyのものはとても馴染めないものだったので、折れ線グラフで妥協した。

geopandas のインストール

pip で geopandas のインストールが出来なかった。
同じ問題で悩んでいる方の福音となればとの想いで書留めたメモです。

当方の環境

  • windows 7 64bit
  • python 3.7(単独でインストール)

Visual c++ をインストールし、ググって調べたあらゆる方法を試みるも、パッケージの依存関係の所為か全て失敗に終わる。
そんな時に見つけたのが、Windows バイナリを入手してのインストール方法。

配布元:Unofficial Windows Binaries for Python Extension Packages

このサイトから、geopandas‑0.4.0‑py2.py3‑none‑any.whl を探しダウンロード。
(C:\Users\ユーザー名\Downloads にダウンロードしたものとする。)

次に

として、pip の実行。

悩みに悩んだ geopandas のインストールが、実に簡単に success!

ぬか喜びに終わらないよう、その動作確認を

既定のブラウザが起動し、地図が表示されて OK!。

なお、上を実行すると次のようなワーニングが出るが、無視して構わないらしい。

Apacheが起動しない場合の対策

このところ、ウィルスバスターが原因でPC起動時にapacheが立ち上がらない。
仕方ないので、「ウィルスバスター停止→xampp-controlからapache起動→ウィルスバスター再起動」を毎日繰り返している。
原因がはっきりしているので、こちらはトレンドマイクロに問合せ中であるが回答がない。

今朝方は、これに加え「PID 4」がポート80を使用してとのことで、上の手順でも起動せず。
インターネットをググって何とか対策ができたので、その手順を残して置く。

1. プロセスID(PID)の特定

ポート80を使用しているPIDを特定する

2. タスク名の特定

ポート80をListenしているPIDからイメージ名(タスク名)を調べる

3. サービスの停止

(2019/1/8 追記)
原因は、PID 4 System が port 80 を使用しているのが原因であった。
System 自体は停止できないので、その中でどのサービスが port 80 を使用しているかを特定する必要がある。
Opening Up Port 80 For Apache to Use On Windowsにその一覧が有るので、一つ一つサービスを確認する。

今回の原因は「Web Deployment Agent Service」(参考サイト(1)に同じ)。
このサービスが、何故起動するようになったかは不明ではあるものの、これまで使っていなかったので停止しても問題はなかろうとの判断の元、これを停止することにする。

「スタート→管理ツール→サービス」として、表示されたサービスの中から一致する名前を探し、それをダブルクリックして次のように設定する

(1)スターアップの種類→「手動
(2)サービスの状態→「停止

その後、apacheの起動。

4. 参考サイト

(1)Windows7でApacheが起動しない
(2)WebMatrix とポート80 の関係を断つ方法
(3)netstatでリッスンしているプロセスを特定する
(4)Windows で Port 80 を使っている PID 4 ってナニヤツ