2005年07月25日

7月度 LILO Monthly Seminarに行ってきた

昨日の7月24日(日)、LILOのMonthly Seminarに行ってきた。

普段知らないことばかりで勉強になった。


懇親会では楽しかったけど、記憶がさだかでない。
おかしいなあ、アルコールは摂取していないのに。

矢吹さんが日経Linuxの8月号に「Debian sarge」の記事を書かれたとか。
赤松先生が日経Linuxに来月号からコアな話を連載されるとか。
Debian 辞典は使ったことある人向けだとか?
そんな話だったような。


今日の資料に関しては公開されるとはず。
矢吹さんは公開するとおっしゃってた。


以下、セミナーのメモと探してきた参考リンク。
---------
CUDJO@京都さん「全文検索システムのお話」

検索するための文の分け方として、形態素解析とN-gramがあるらしい。

○N-gramは、一定の文字ごとに分解する。
 2-gramなら、2文字ずつに。1文字ずつずらして分解するとのこと。

 関連リンク
  Nグラムによるテキスト研究
  http://www.ya.sakura.ne.jp/~moro/resources/ngram/

  N-gramモデルを利用したテキスト分析
  http://www.shuiren.org/chuden/teach/n-gram/index-j.html


○形態素解析は、単語単位に分割するとのこと。
 辞書に照らし合わせて解析するらしい。

 形態素解析ソフトとしてはKAKASI茶筌(Wikipedia説明)、MeCabが紹介されていた。

 関連リンク
  Wikipedia 形態素解析
  http://ja.wikipedia.org/wiki/%E5%BD%A2%E6%85%8B%E7%B4%A0%E8%A7%A3%E6%9E%90

  形態素解析・構文解析入門
  http://www.unixuser.org/~euske/doc/nlpintro/


全文検索システムとしては、「Namazu」、「RAST」、「HyperEstraier」が紹介されていた。

Namazuが形態素解析、RASTとHyperEstraierがN-gram。
N-gramは、ミスヒットやノイズは仕方がない。RASTはすべてのデータの位置情報を持つことで、HyperEstraierは後続N-gramデータの情報を持つことで、対策しているとのこと。

---------
大浦さん「Subversion による共同管理の Web ページの構築」

Webページを複数の管理者で運用する場合、バージョン管理システムを使えば、元に戻せたり、履歴が残るのが利点とのこと。

バージョン管理システムではCVSが一般的だが、問題点がある。

CVSの問題点。
ファイルやディレクトリの移動、削除がうまくできない。
CVSROOT/loginfo でコミット後に任意のコマンドが実行できるが、複数のファイルを同時にコミットすると、コマンドが複数回同時に実行されて、ファイルの不整合が起こりうる。

Subversionでは、これらの問題が解決されていますとのこと。

SubversionのファイルシステムはBerkeleyDBでは、バックアップがうまくいかない場合があったけれど、FSFSになってコミットごとにファイルが増えていくだけになったのでよくなったとか。


私は、正直CVSの理解が怪しいのだけど、CVSには問題があるということはよくわかった。


参考リンク
 大浦さんのドキュメントのページ
 http://www.netfort.gr.jp/~ohura/document/index.html

 大浦さんが2004年1月のLMSでSubversionについての発表されたときの資料
 http://www.netfort.gr.jp/~ohura/document/lms200401.pdf

 Subversion によるバージョン管理
 http://subversion.bluegate.org/doc/book.html

 osdev-j Subversion
 http://osdev-j.sourceforge.jp/?Subversion

---------
矢吹さん「OpenOffice.org 2.0 beta のビルドについて」

OpenOfficeのソースコード150万行以上あるそうで、はじめからビルドすると6時間もかかったとか。

OpenOfficeとStarOffice
 ソースコードはフィルター以外は共用

Sunは、ドイツのハンブルグにOpenOffice.org/StarOfficeの開発部隊を100人くらい抱えているそう。

OpenSourceが中国、インドで伸びてきつつあり、日本の要望が埋没の危険性。
 日本語の要望をうまく伝えないと
 CJKの中では、まだ一日の長と見られている
 レポートをあげて行くしかない。
 日本語対応への危機?

OpenOffice.org 勉強会をされているとのこと。
 ソースコードをみんなで読む
 誰かが見てるソースコードをみんなで見る
  →プロジェクターで移す
  1箇所にまとまった方がいい
 ソースコードをHTML化→Gnu Global
 教科書:Code Reading

Sunの開発スタイル
 ライセンスはSunとのジョイントライセンス
 Sunとの共同著作権(JCA)にサインしないと絶対commitされない
 矢吹さんもサインされているらしい。

IssueTracker
 バグ報告、機能改善要望、課題:誰でも
 パッチ:登録が必要

参考リンク
 OpenOffice.org日本ユーザー会
 http://ja.openoffice.org/

 OpenOffice.org日本ユーザー会 ビルドの方法について
 http://ja.openoffice.org/documents/develop/build.html

 非公認 OpenOffice ハッカーズガイド(矢吹さんが紹介されていたサイト?)
 http://ooo.ximian.com/hackers-guide-ja.html
posted by 端っこなひと at 03:46| Comment(0) | TrackBack(0) | セミナー・勉強会 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック