2010-08-01から1ヶ月間の記事一覧

ピアソン相関

ピアソン相関係数を使った類似度 AさんとBさんがX,Yという映画を評価した場合、次のような点数になったとします。 - A B X 80 40 Y 60 30 この場合、AさんもBさんもYよりもXという映画のほうが好きだという点で類似しています。高いスコアをつける傾向がある…

ユークリッド距離

集合知プログラミングをやりたくなった オライリー社から発売されている書籍なのですが、ユーザーの行動履歴から、嗜好を分析するというプロモーションで使われる技法を紹介しています。言語はPythonです。どんなことをしたいかというと、amazonでよく見かけ…

LinuxのI/O

最近Blogに書くネタが「ファイル」に特化してきてだんだんPerlが関係なくなってきている今日この頃ですが、そんなことは気にせずにLinuxカーネルのI/Oについての覚え書きです。 概要 次の3つに関する、広く浅いメモ 仮想ファイルシステム ページキャッシュ …

LinodeでInnoDBチューニング(3)

概要 innodb_log_buffer_sizeをlog fileのサイズと勘違いしていた事が発覚したので修正したら、過去の記事とは違うベンチマークがでました。前回までのベンチはinnodb_buffer_pool_sizeを大きくしていったものでしたが、それに合わせてログファイルを大きく…

LinodeでInnoDBチューニング(2)

概要 前回、innodb_buffer_pool_sizeをちょっと大きくしたら性能がだいぶ変わったのでmysqldの使用メモリを全体の80%になるまで、少しずつあげてみたという記事です。 試したinnodb_buffer_pool_sizeの値 240MB, 300MB, 360MBを試しました。mysqldのプロセス…

LinodeでInnoDBチューニング

概要 前回(今朝)の記事で使用したmy.cnfでMySQL Benchmark Suiteのinsertに関するベンチマークをとってみました。 今回はinnodb_buffer_pool_sizeとinnodb_log_buffer_sizeを変更してみたらどれだけ数値が変わるのかを見てみる試みです。 my.cnf 前回の記事…

LinodeでInnodbの設定ファイルを考える

概要 Linodeで自作WEBアプリを公開していたりしますが、mysqldを立ち上げることがなかったので(参照メインなのでmemcached+SQLiteで足りていた)あんまりmy.cnfのパラメータを考えてなかったんですがちょっと考えてみたという話です。 設定ファイル my.cnfは…

mysql-benchでデータベース負荷テスト

mysql-benchをインストール % sudo yum list --enablerepo=remi | grep mysql-bench mysql-bench.i386 5.1.49-1.el5.remi % sudo yum install --enablerepo=remi install mysql-bench どこに行ったのかを調べます。 % rpm -ql mysql-bench ... /usr/share/sq…