Undefined Title

Docker + Jenkins + serverspecでpuppetのmanifestをCIする

2013-09-28

puppetのCIが運用レベルに到達したのでちゃんとまとめておこうと思う。

下のリポジトリを使ってこの記事どおりにすれば、AWSにDocker + Jenkins for puppetのCI環境ができるはずだ。

https://github.com/tmtk75/ci-puppet

当初は「はよpuppetマニフェストをCIせなヤバイなー」という問題意識が先にあって、使う技術は何でもよかった。 やっぱレシピとかマニフェストってちょっと気を抜くと壊れるよね。 というか壊すよね。 ってか、最近すでに二回やっちまってるよね、俺。 ごめんなさい。 そう、まさにマニフェストのCIが急務だったわけです。

で、日本語リソースのDevOps的記事では、「Vagrant + serverspec + JenkinsでChefのcookbookをCI」というのが多い気がしてる。

ちょっとググると@naoyaさんのこの辺がひっかかる。

puppetだと@gosukenatorさんのこの辺が見つかった。

両記事とも本当に参考にさせて頂きました。 で、AWS + Jenkinsとか、Vagrant + Jenkinsとか、Docker + Ukigumoとかいろいろ試したんだけど、 Dockerのgitのような履歴の取り回しのよさは魅力的だし、同僚達も使い慣れたJenkinsがやはりよかったので 最終的に Docker + Jenkinsの組み合わせに落ち着いた。

個人的な開発とかではchefで書くんだけど(Berkshelfいいよね)、仕事ではpuppetの資産が多いのでしょうがなくpuppetも後から学んだ。 入門Puppet、入門Chef Soloはサーバサイドに関わるエンジニア必読の二冊と思う。 puppetからchefへ移る人は多そうだけど、逆はあまりいなさそうな雰囲気がある。気のせいかな。

ちなみに「puppetは古い」って思ってる人もいるかもしれないけど(実は私もそうでした)、ちゃんと知ってからはエンタープライズではpuppetオススメだと思っている。 外部DSLってのはchefみたいな内部DSLに比べて自由度ないけど、言い換えれば誰が書いても一定の枠組み以内の書き方に収まる。 自由度高すぎるとカオスになりがち。多くの人がメンテする可能性のあるときはpuppetのその点は強みになる。 依存関係がかっちり書けるのも理解すれば便利。 chefの書いた順ってのは分かり易いけどね。

VagrantやAWSだとどうしてもジョブを実行した後にインスタンスを破棄することになって、ジョブが失敗したときの事後調査がしにくい。 Dockerならstopしたcontainerを再度startすれば、ジョブ終了時の状態にログインできて失敗原因の調査がしやすい。 これは大きな魅力だと思う。

あと、Dockerを走らせるOSとしてはCoreOSも試してみたんだけど、 Jenkinsを動かしたかったし、制限がキツくて結局無難にubuntuに落ち着いた。

やったこと

さて、本題。今回構築したCI環境のは以下の環境。

職場で構築した環境では、Jenkinsの認証関連にLDAPを使ったりとかした。

ホストの構築 on AWS

ubuntu-12.04 LTSを使うのだが、AUFSが使えないAMIがあるので注意。 東京リージョンではAMI: ami-c83c8fc9を使った。 他のリージョンでは https://aws.amazon.com/marketplace/pp/B007Z5YWX4 ここから探してください。

私が行ったインスタンス起動時の主な設定は以下。

DockerとかJenkinsとかのファイルはEphemeral diskに置くので最低1つは必要。 Jenkinsがデフォルトでは8080ポートでlistenするので、security groupで8080を開けておく。 あとはお好みで。

実際のホストの構築にはfabricを使った。シェルスクリプトでもいいんだろうけど。 このホスト自体の構築にpuppetを使ってみようと思ったんだけど、やってみたら圧倒的にめんどくさかったのでfabricにコマンド直書きした。 とりあえず構築手順をできるだけ残すという目的は達成しているのでよしとする。

構築手順

EC2インスタンスが起動していれば、とりあえず次のコマンドでいけます。

$ git clone https://github.com/tmtk75/ci-puppet
$ cd ci-puppet/test/ci-server
$ fab -i ~/.ssh/<keypair-name>.pem -u ubuntu -H <public-dns> setup

だけじゃなんなので、fabricでやってることを簡単に説明するとこんな感じ。 実際のfabfile.pyはこちら

Dockerのインストール時は、@naoyaさんの記事を参考に/etc/init/dockerd.confを置き換えている。 ただ、よく考えたらホストOSからしかDockerのREST APIへはアクセスしないから必要ないのかもしれない。

Docker imageのビルド時は同様に@naoyaさんのDockerfileをベースにした。 Dockerの各containerへsshでログインするときに使うRSA鍵を生成してからdocker buildコマンドを実行。 /etc/pam.d/sshd/etc/sudoersを置き換えたり、puppetをインストールしているところが追加の点。 これらをしておかないとDocker containerへsshでの接続がうまくいかなかったり(接続した瞬間にConnection Closedになる)、 sudoでの実行ができなかったりする。

/etc/pam.d/sshd 下記行をコメントアウト
#session    required     pam_loginuid.so

/etc/sudoers 下記行をコメントアウト
#Defaults    requiretty

CI時に使うパッケージをapt-getでインストールする。 ci-puppetリポジトリでは変更していないが、職場で構築した環境ではruby2.0.0-p247をソースからインストールする手順を追加している。 最初はserverspecはruby1.8.7でも動作するし、ubuntuにプリインのruby使ってたんだけど、同僚が「serverspecで2.0の文法使いたいよ」というのでソースから入れることにした。 この辺はomnibus-rubyとかでうまいことrpm作れないか今度試す。

最後にJenkinsユーザが使うsshの設定。ssh接続時のホストのバリデーションを無効にするのがポイント。 そのための.ssh/configを置く。

Host github.com
  StrictHostKeyChecking no
  UserKnownHostsFile=/dev/null
  User git
  IdentityFile ~/.ssh/github.pem

Jenkinsの設定

Jenkins自体はgit pluginを入れた以外は素に近い。

Jenkinsの管理 -> プラグインの管理 -> 利用可能タブ -> フィルターで"git plugin"

で、Git Pluginにチェックして、”ダウンロードして再起動後にインストール”ボタンを押してインストール。 後は認証としてLDAP + マトリックス認証を使ったが、これはもちろん状況に応じてなんでもいい。 何がめんどくさいって、Jenkinsの設定は手作業なこと。一発でバシッとやる方法はありますかね。たとえばslaveを増やしたいときとかWebUIでいちいち設定するのめんどくさいよね。

新規ジョブの作成と実行

次の4項目を入力。

全部入力したら保存し、おもむろにビルド実行してみよう。コンソール出力に以下のように出ていたら期待通りだ。 テストケース2件中1件失敗するはず。

Started by user anonymous
Building in workspace /var/lib/jenkins/jobs/webapp.example.com/workspace
  .
  .
  .
spawned container_id: 870bba0aadb2         <- Docker containerをひとつ作成
  .
  .
  .
docker-apply exited with 0.
/usr/bin/ruby1.9.1 -S rspec spec/webapp/httpd_spec.rb    <- serverspec開始
Service "httpd"
  should be enabled (FAILED - 1)
  should be running

Failures:

  1) Service "httpd" should be enabled
     Failure/Error: it { should be_enabled }
       sudo chkconfig --list httpd | grep 3:on
       expected Service "httpd" to be enabled
     # ./spec/webapp/httpd_spec.rb:4:in `block (2 levels) in '

Finished in 0.28702 seconds
2 examples, 1 failure                                      <- 2件中1件失敗

Failed examples:

rspec ./spec/webapp/httpd_spec.rb:4 # Service "httpd" should be enabled
/usr/bin/ruby1.9.1 -S rspec spec/webapp/httpd_spec.rb failed
docker stop 870bba0aadb2                                   <- container 870bba0aadb2をstop
Build step 'Execute shell' marked build as failure
Recording test results
Finished: FAILURE

また、2回以上実行するとテスト結果の推移のグラフが表示されるだろう。

とりあえず環境構築はこれで終了。 あとは、シェルスクリプトが何をやってるかを見てみる。

ci-job、その他シェルスクリプト

Jenkinsのジョブは基本的にシェルスクリプトを起動するだけ。 終了コード0 or その他を返す。

  1. Dockerのcontainerを新しく作る。container IDが払い出される。先の例だと870bba0aadb2
  2. manifestsとmodulesをrsyncで送る
  3. ssh経由でstandaloneモードでpuppet applyを実行
  4. serverspec実行 over ssh

ci-job

ci-jobはDocker image ID、manifestsとmodulesのpath、certnameを受け取る。 「このスナップショット(Docker image ID)から起動して、これらのマニフェスト(manifests/modules)でこのホスト(certname)を構築してね」ってことだ。

containerを新たに作成するコマンドはsudo docker run -d core/sshd。 container IDが分かるとREST API経由でcontainerのsshのポートが分かるので、以後それを使ってover sshでドライブする。

docker-rsync

docker-rsyncでmanifestsとmodulesをコピー。 docker-applyの中で使っている。

ここでもssh接続時のホストのバリデーションを無効にするのがポイント。

--rsh="ssh -p$tcp22 -o UserKnownHostsFile=/dev/null -o StrictHostKeyChecking=no"

sshのportはREST APIで取得する。

 curl -s localhost:4243/v1.4/containers/$1/json \
   | ruby -e 'require "json"; print (JSON.parse STDIN.read)["NetworkSettings"]["PortMapping"]["Tcp"]["22"], "\n"'

2013/10/02追記:

こんなツイートが。なるほど、-vオプションなんてあるのね。うちでも使えないか試してみよう。

-v=map[]: Bind mount a volume (e.g. from the host: -v /host:/container, from docker: -v /container)

docker-apply

docker-applyでpuppet applyを実行する。

知らない人も多いみたいなんだけど、puppetにもchef-applyみたいなstandaloneモードがある。 chef-applyはchef11からだから、むしろpuppetの方が先。 一番簡単に実行するだけならpuppet apply a.ppみたくファイルひとつで実行可能。 このpuppet applyでrsyncしたマニフェストを実行する。

certnameを使うと任意のnode名を指定することができる。指定しなかったら基本的にはホスト名が使われる。/etc/puppet/puppet.confとかでも指定できる。

マニフェストが壊れてたりすると終了コード0以外が返ってくるので、そのときはserverspec流さないでエラー終了。

serverspec

puppet applyが成功したらrakeでserverspecを実行する。 実際に実行するコマンドはrake docker:webapptest/spec/spec_helper.rbでdockerのcontainerへserverspecを実行するように設定している。

テスト対象のホストを追加するときは、のようにする。

あとはJenkinsのジョブをwebapp.example.comと同様に作る。

これで、もりもりテストを書いておけば、マニフェストのリファクタリングもガリガリできるってもんだ。

まとめ

振り返ってみると、やってることは大したことしてない。Docker走らせて、rsyncして、puppet applyして、serverspec流してるだけ。

ただ、これをover sshでやるところでところどころハマりポイントがあった。ホストバリデーションでAre you sure you want to continue connecting (yes/no)? とか聞かれて止まるとか、sudoしようとするとsudo: sorry,you must have a tty to run sudo.とか、Dockerへのssh接続がConnection closedといきなり切れるとか。

まあ、とりあえず動いているようなのでテストの充実とマニフェストのリファクタリングをしていこうかと。

課題はclean upかなあ。 sudo docker ps -aで見るとジョブごとにcontainerが作成されるので大量のcontainerが残っているのが見える。2週間くらい運用してて、50GBくらい使用しているっぽい。 Ephemeral diskの15%くらいを消費しているので、数ヶ月くらいでdisk fullだ。まあ、バッチで古いcontainerから消していけばいいかな。

いやー、それにしても久しぶりにこんな長い記事書いた。