prasinos' work memo

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

英文訓読事始 (2)

さっきのは一通りマークアップしてみた印象でした。今度は読み下して見ます。

・どこからスタートしていいのかよくわからないという問題にブチアタリます。同じ番号がたくさん並んだ系列の最後の番号にマルをするといいでしょう。これで、オーバーラップした番号系列をどこから読み始めるかも解決するはず。

・数字の1と読み仮名の「ノ」がとてもまぎらわしい。ここだけ規則やぶってひらがなの「の」を使うほうがいいでしょう。

・前置詞や冠詞は置き字扱いにすることが多いので、返り点がついていない語を見逃す習慣がついてしまいます。最初はそれはよくないと思って置き字に抹消線をひいていたのですが、あまりに面倒なのでやめました。返り点がついていないメインワードにはなにかマークアップをしたほうがいいかもしれません。右矢印かなあ。
スポンサーサイト

英文訓読事始

それで、やってみたわけである。

やってみると、伝統的な漢文の返り点をそのまま使うのは無理があるので若干変更せざるをえないことがわかる。

まず、横書きであるから上下どちらに点を打つか決めなければならない。これは、漢文を時計回りに90度回転したものと考えて、語の右上に送り仮名、右下に返り点とするのが自然そうだ。

つぎに、普通に印刷した文章に点を打つので、甲乙丙丁だの天地人だのと書いているスペースは無い。漢数字もいまいち横幅をとる。どうしてもアラビア数字が合うようだ。レ点はそのままでもよさそうだ。

ついで、英語の方が漢文より複雑な文が多いせいか、ものすごく長く戻る文が多い。数字を9まで使い果たしてしまう。そもそも逆行することはわかっているので番号を順につけなくても同じ記号だってかまやしないはずであって、番号1のところがスタートポイントになっていることだけが意味のある情報だ。なので、系列に番号を打つことにする。

I love1 New York1, but I don'tlike2 traffic jam2.

で、甲乙/天地のようなオーバーラップする構造も数字で区別できる。

とりあえず今はこんなところ。もうすこし記法に工夫できるかもしれない。

酸性紙の保存

酸性紙は放っておくと痛むという。で、アメリカではアルバムに色々の紙を貼っ付ける「スクラップブッキング」というのが割りとポピュラーなのだけれど、その用品店では酸性紙対策スプレーなるものを色々置いている。よくみてみると、2種類あって

  • アルカリ緩衝溶液をかけて中和する型
  • コーティングする型

があるみたいだ。どっちが有効か?


結論からいうと、アルカリでないとダメということみたいである。そりゃそうだ。外気から多少は酸が入ったりするかもしれないが、紙繊維の中にすでに酸や酸のもとがあって、そいつを消さないことにはどうしようもない。
参照



ところでどうでもいいのだが、この手の怪しげな化学物質を含んだ製品の主成分を知ろうと思っても、ろくすっぽ書いていないことが多い。日本の家庭用品品質表示法のありがたみがわかるところである。

印刷しまくり

ちょっと勉強するぞというわけで、印刷しまくり。

もうそれはものすごい分量である。

これだけ読んで訳したいと考えているが、とりあえず下訳をどうしたらいいか。実は、オフラインどころかキーボードに触れない時間がけっこうあるので、とりあえず印刷して見たのである。スペースにかんがみて、漢文の訓点みたいなものを開発するとよいかもしれない。

楕円の式と地理・地心緯度の換算

地理緯度と地心緯度の相互換算をしようと思ったら、ちょっと高校数学の復習になってしまった。 続きを読む

ぷりんた

HP せいの いんくじぇっと ぷりんた を つかっている。
ま、 たんてきに いって やすものだ。
さーど ぱーてぃーの いんく つめかえ きっとを かうと、
1ねん かん しょき とうしだけで つかうことが できた。

ところが いっさくじつ、 とつぜん いんさつ そくどが おそく
なったと おもったら でんげん らんぷが てんめつして
うごかなく なって しまった。

HP の うぇぶにある とらぶるしゅーと まにゅある
(これは ありがたい) に よると らんぷ てんめつは

1 かみぎれ
2 かみづまり
3 いんくかーとりっじが ない
4 こしょう -> しゅうりに だしてね

という ことである。 3 か 4 なので、 だめもとで あたらしい
いんく かーとりっじを かってみた。 つめかえの こんせきが
ある かーとりっじを つけて しゅうりには だせないしね。

すると はたして うごくでは ないか。 「そろそろ いいかげん
かねを はらえ」 という おつげ だったのである。

球面投影法の時の緯度とは

わかったつもりでも、よく考えてみるとわからないことがあるものだ。

地図投影法では、球面からの投影をよく考える。このときA地点の緯度とは、
明らかに地球中心からAを見たときの赤道面からの仰角である。
こういうのを地心緯度という。

ところで、ふつう緯度といっているのは地理緯度といって、
地心緯度とはまったく別物である。
それはA地点直下(この「下」は重力の方向)のジオイド上の点を
通る回転楕円体の法線が赤道面となす角である。

だから、地心緯度と地理緯度は混同してはいけない。中緯度では20kmくらい
ずれている。

しかし、どうやら単純に球面投影で地図をつくるときは、
地理緯度で測定した地物の緯度を投影法の式の地心緯度のところに
突っ込んで「投影」しているらしいのだ。

いつも読んでいる Snyder (1987) の 4 章 "Distortion for Projections
of the Ellipsoid" のところで、そういった球面投影による地図の変形を
論じているのだが、東西・南北のスケールファクタの算出は単に

球面上の経度1ラジアンの距離 / 楕円体上の経度1ラジアンの距離

でやっているのだ。そんなのってありか。

でも、考えてみればそれもそうだ。昔楕円体がまともに構成できなかった頃
(19世紀中ごろまで) は、天文観測以外に緯度決定法がなかったわけで、
それで地球を球と信じて地図にプロットしたら、それは要は
「地理緯度を地心緯度とみなす」ことである。

[redhat] ruby-mysql

I installed version 2.6 making RPM by myself.

[redhat] mysql initialization

I ran initialization script. I have set root password. But that is not enough. I have to make normal user and do some configuration. 続きを読む

[redhat] mysql

I want to use MySQL. I have some experience in PostgreSQL, and I want to know another major free RDB. 続きを読む

MySQL 勉強中

突然であるが、MySQL を勉強してみることにした。

というのは、リアルタイムかつすげー量のデータを(実際には扱わないまでも)想定した研究をしたいわけである。そうすると、経験的に一番厄介なのが「このファイル何?」「新しいファイルどこに作ったらいいの?」「ディスク逼迫してきたけど消すのどのファイル?」というような管理なのである。

たとえばファイル長が長すぎると性能が落ちるだとか、長い期間のデータを集積しないと1つのファイルが完成しないので待たされる方が迷惑するからファイルを細かく分けたいだとか、分けすぎて何万というファイルが1ディレクトリにあると一覧できないどころかファイル名を決め打ちしてもアクセス性能が落ちる、とかいろいろの問題があるので、普通はデータが適当に配列されるようにディレクトリ名規則を場当たり的に考えるわけである。

しかし、DBMS 使えばそんな心配はいらなくなる。いや、まあ、その、特殊ネットワークで接続された3000CPU並列計算機に分散された30テラバイトのディスクにそういうことしたらヤッパシまずいかもしれないが、まずくないかもしれないし、万一ダメでもまあ世の中そんなんばっかしではないし。

で、ローカルな DB の足回りをドカーンと MySQL に変えちゃったらどうよ、というわけ。
うまくするとすげーインパクトがあるよ。

で、とりあえず勉強してみる。今インストールが終わって初期設定がたぶんできたところ。
で、思うんだけど、
MySQL のリファレンス
とてもよくできている。PostgreSQL のドキュメンテーションも最近ではよくなったのかもしれない(みてないごめん)が、日本語マニュアルはちょっと遅れがちだし。
やっぱりユーザ数多いってのは偉いよ。いや、その、ロールバックがあればうれしいんだけど、ま、なくてもなんとかなるかなあ。。。。

[trans] Ho et al. (2005): NetCDF 属性と GeoTIFF タグの間の自明な一対一対応はほとんどない

英語の論文を読解のため勝手に日本語訳することをシリーズ化してみたい。翻訳はバスの中でもできるからね。 なお、今後とも、何日かかけて追記していくエントリになる場合が多数あろうと思うので御容赦願いたい。

まずはじめは、AMS 2005 Conference できいた、Ho et al (2005). 原文はhttp://ams.confex.com/ams/pdfpapers/84803.pdfにある。

超訳要約:

  • NetCDF から GeoTIFF へのメタデータの変換を試みた
  • メタデータには構文的属性(格子データが格子データで あるために不可欠な配列寸法等)と意味的属性(その他)がある
  • 構文的属性は簡単に機械的に変換できる
  • 意味的属性の機械的変換はとても難しい
  • 特に気象データには地理参照情報がないので困る
続きを読む

[fortran-stdio] OPEN 文の STATUS 指定子など

なんだかやっているうちに、ブロック I/O 層のインターフェイスは open(2) に似て来て、その上のお客さんインターフェイスは fopen(3) に似て来た。あたりまえだが。

で、OPEN 文の ACTION, STATUS 指定子は文字型である。これは結構なんだけど、open(2) みたいにフラグの集まりに直交分解したいわけですよ。ライブラリルーチンを書いていて文字列引数の正当性を多くの層でチェックするのはちょっとぞっとしない。 続きを読む

XLF DOC

このところ Fortran とかなんか適当なキーワード突っ込んでググると
こいつが出てくる。大変便利そうである。XLF のメーカーさんありがとう... といいたいところなのだが、このアドレス、ミネソタ大学だよね。大丈夫なのかな。

vsh

ちょっと事情があって /var/log のログを眺めてみたくなった。昔は誰でも見られる /var/log/syslog をだらっと眺めるだけでよかったのだが、今はサービス毎にいろいろのログファイルが作られ、その多くはスーパーユーザのみ参照可能になっているのが当世流だ。するというと


$ cd /var/log
(えーと何があったっけ)
$ ls
lastlog
mail
syslog
(lastlog って何だっけ?)
$ tail lastlog
tail: lastlog: permission denied
(ちきしょー)
$ sudo tail lastlog
Password: ひみつ
化け文字....
(あぎゃー)


というようなことになるわけだ。しかも sudo 一発やるごとにログが残るので後ろめたいことこの上ない。そこで、ビジュアルシェルとなるわけだが、なんか root で GUI というのも如何なものか感が漂う。しかたがないので堀りだしてきたのが昔作ったプログラム。

x

画面トップにディレクトリリストが出て、hjkl で移動、エンターでディレクトリに入るか more が起動し BS で上がる。 e/v で emacs/vi が起動。ま、FDclone みたいなものですね。

curses の習作のつもりだったのだけど、微妙に便利でいまだにどうも捨てられない。tar ファイルのタイムスタンプをみたら 1994 年 11 月だという。もう 11 年も前のプログラムではないか。こんなのが堂々無修正で現役で動いてしまうんだから呆れる。UNIX は変化がないから素晴しいというべきか、UNIX は進歩がないというべきか、はたまた私のワーキングスタイルに変化がないと言うべきか....

ERDAS LAN ファイルの形式

さっきまで自作カナ入力を必死にしていたが、よくみたらこの端末は日本語入力可能ではないか。情けない。

さて、GIS にラスタデータを突っ込むときに、フォーマット変換ということは起こると思うのであるが、自作派にうれしい簡単なのがある。ERDAS LAN 形式である。

で、だからどうしたのかというと、左上角の座標指定という方式はどこかで見たような気もするが、とっても普遍的につかわれているということがわかる。 続きを読む

URL めも いろいろ

がっきちゅう URL めも が いろいろ たまって いました。
たんに URL を りんく する だけでは つまらないので、
なにか ひとこと くらい かこうと おもいつつ
ずっと できないで いました。

とりあえず URL しゅう だけ ぶろぐに ぶちこんで おけば
よかったの かも しれないけれど、 いったん きじが しずんで
しまったら どうせ さいはっくつ できないので これで よかったの
でしょう。

* NASA J-Track 3-D

いろいろ の えいせい が どこに いるか とらっく できる。
たぶん ほとんど の えいせい が りすと されて いる。

* Earth Explorer

DEM、 こうくう しゃしん, えいせい しゃしん, ちず など が さがせる
USGS の くりありんぐ はうす。 りすと みる までは とうろく ふよう。

* GloVis

LANDSAT, MODIS などの えいせい がぞうが みられる。
Java ひつよう。

* Landsat.org

LANDSATの しゅくしょう がぞうを みて ちゅうもん できる。

* ERSC MODIS ImageServer
* ArcExplorer Web examples
* ArcExplorer Java Download Site

Education Version for both Win and Mac available

えいせい かいめん すいおん でーた

いろいろの えいせいから えられる かいめん すいおん でーた が
http://poet.jpl.nasa.gov で あくせす できる。
なお、 みるのに Java が ひつよう みたい。

* えいせい: AVHRR、 NAVOCEANO (なんだ これは?)、 NCEP OI、 Terra、 Aqua、
GOES 10-12、 GOES 9 (Pacific)。

* ふぉーまっと: GIF, JPEG, PNG, netCDF, HDF SDS, HDF Raster,
GeoTIFF for ArcGIS, GeoTIFF for browser, ARC GRID ASCII,
Binary (for little and big endians), ASCII, OPeNDAP

さいごの ふぉーまっと りすと は なにを じつげん すべきかの
さんこうに なる。

いわれて みると あたりまえ だが、 GeoTIFF と いっても
RGB さんそう からー ひょうじ が ぶらうざ には よかろうし、
ものくろ れいやー が ArcGIS で かいせき するには
よかろう。

ARC GRID ASCII って なんだろう。

ところで、 ここで GeoTIFF for ArcGIS を えらんでも、
ArcGIS は かいきゅうち しか にんしき せず、 おんどを
だして くれないので、 Arc Toolbox の
[Spatial Analyst -> Raster Calculator]
めぬ で るっくあっぷ てーぶるを つくる ひつようが
あるのだ そうだ。 これは ためして いないので よくわからん.

[fortran-stdio] 内部バッファは嫌だ

そんでその、デジャブの話。

blkio_read にバッファ渡されて読む。EOF 喰らってエラーになる。記録長を短縮して読み直す。このとき、内部バッファを避けたければ、元の記録長の約数で割らなければならない。

それから、無駄と判っていることはしない。つまり、2分割なら1個だけ読めばさらに分割できる。16分割なら15個だけ読めばさらに分割できる。

(ofs, width) を状態として持つ。読んで読めたら (ofs, width) += (reclw, -reclw) する。

[fortran-stdio] 下に層があるべきだ (続き)

それで、どうして今まで下から書きはじめなかったのか後悔しているです


言葉にしてみるというのは不思議なもので、深く考えたつもりでも、読み
返してみるとけっこう恥ずかしいことしか書いてなくて、考えたことも書
き切れていないし、まあ筆力不足ですかねえ。

下層を blkio と名付けるとして、これ書いているわけですが、ブロック
が EOF に当たってしまう場合の対処ロジックを書いていると、ホントに
デジャブ感がたまりません。もうちょっと何とかならないのかなあ。

たぶん、そういう事を気にしないでつっ走れないといけないのだと思う。

[fortran-stdio] 下に層があるべきだ

ほとんど忘れ去られた状態の fortran-stdio であるが、都合により永遠に放置しておくわけにもいかないので、梃入れ。

前回は、ダイレクトアクセス入出力を基本にして作るべきだという所まで考えた。ファイルエンドがレコードの内部にある場合に備えて、レコード長は動的に変更すべきだとも考えた。その上で、よせばいいのに上位層から設計を開始していきづまった。

今回は下層から考える。要は、「普段は固定長レコードに振る舞うけれど、いざというときはレコード長を変えてでも未完成レコードを読み書きする。でも動的レコード長変更は隠蔽する」というクラスが下層に別れているべきなのだ。

そっちから作ってみることにする。入出力ができるので、テストコードも書けるようになる。

ローマ字仮名変換

前にも書いたようにここには日本語記事を書こうと思っているのだが、英数字しか入力できないことが多いので果たせないで来た。しかしあまりにも不便であるので、ローマ字仮名変換をする CGI を作ってみた。

こんな感じである。

入力

I also need lrzsz

Mandrake provides the newest. But rpm -i .....srpm complains something. It is probably fine, but I'm not sure. Probably the best one is Fedora Core:

http://rpmfind.net//linux/RPM/fedora/development/src/lrzsz-0.12.20-21.src.html

-----

It seems to work well.

I want kakasi

http://www.rpmfind.net//linux/RPM/redhat/8.0/i386/kakasi-2.3.4-8.i386.html

It was compiled without trouble. I've installed packages kakasi and kakasi-dict.

It should be very meaningful to note that I often use this wrapper to romanize japanese texts.

$ cat bin/romanize
#!/bin/sh
cat "$@" | /usr/bin/kakasi -s -Ea -Ka -Ha -Ja -rkunrei

測地学テキスト

測地学会編の教科書というものがあるんだそうな。ここで勉強したことを日本語のノートにまとめないといかんと思っていたが、そう。こういうものを作らないといけないのだよ。

時間ねえよというのはおいておいて、場所が問題だなあ。

経済にフローとストックがあるみたいに、会計に収支とバランスシートがあるみたいに、情報にもフローとストックがある。じゃんじゃん入って来る情報をログしておくところと、結局どうなったかまとめておく場所が知的生産には不可欠だ。

恐ろしいことに、ブログブームでログ置いておく場所はできた。そこらの無料ブログを使えば誰でも無料で始められるのである。いつまで続くかわからないが(だから私も安全策でニフなんか使っているが)、これはすごいことである。

では、ストックはどうなるんだろう。(それなりに)永続的な場所と履歴管理が必要だ。たぶんWikipedia みたいなのになるんだと思う。でもあんまりオタッキーなこと Wikipedia に突っ込んでウザがられるのも何だし、うーん。誰でも wiki 始められます! みたいなのないのかなあ。

(追記) 学者先生研究者は Wikipedia っていうと反発があるだろうな。名前が残らないような気がするからだ。でも、履歴管理とログインがあるので、ほんとうは大丈夫なんだけどね。

google comes back!

This blog is on the top of google search list!

From April, all my blogs have been purged from google. Some people say that google doesn't like blogs. Some people say google purges blogs with something undesirable statement. I don't know the fact, but anyway I'm glad my blog is referrable again.

Thanks a lot for readers,

So how about Meteosat 8?

Let's see also Meteosat 8 results. 続きを読む

PC1 shows cloud excluding effect of land

I tried PCA for GOES-EAST image of 2005-04-21T17:45Z, in addition to yesterday's Meteosat 8 (2005-04-20T12:00Z). I used all available bands: IR2, IR4, VIS and WV.
続きを読む

PCA trial

Edgecut program is improved to fill zero out of the disk. This will eliminate nasty title bars at top and bottom of the image.
Then try PCA for new result.

Ignore Zero, Write eigenmatrix and eigenvalues, stretch to unsigned char.

One nasty thing of Erdas Imagine 8.3 is that eigensystem log is written in a text file with LF-separated text file. Are they really using Windows?

The result looks good. Even in PC1 and PC2, Sahara and low cumuli are distinguishable.

When I pick two bands from original (befor PCA) image, it is difficult to distinguish Sahara and low cumuli. Band pairs I tired are: 2-4 (lowest correlation), 3-5 (highest correlation with PC1 and PC2), 3-11 (2nd lowest correlation).

Image Size

I measured size of full disk images of Meteosat 8.

At least for 1200Z Apr 0520, the globe is a ellipse whose vertical and horizontal axis lengths are 450.47 and 450.37 pixels respectively. Center of the earth is at (450.47, 450.47) in image coordinate system in which center of the upperleft-most pixel is (0, 0).

These measurements should have 0.1 pixel precision.

FC2Ad

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。