Xbyakで始めるx86(IA-32)入門(2-2) (mitsunari@cybozu labs)

前置きが長くなりましたが，x86(IA-32)について説明を始めます．他のCPUでも概ね似たようなものですが，アセンブリ言語(asm)を記述するときに最低限必要な知識は概ね次の四つです．

アドレス
レジスタ
インストラクションポインタ
スタック

順次説明します．

アドレス

メモリを読み書きするには場所を指定する必要があります．その場所のことをアドレスといいます．32bitOSでは通常32bitの絶対値(0～4294967295)で指定します．主にC/C++におけるstaticな変数やglobalな変数を扱うときに利用します．仮想メモリや物理メモリなどの話はとりあえず無視してかまいません．必要だと思われたときに勉強してください．

レジスタ

CPU内部で利用できる変数のことです．32bit整数を格納する汎用レジスタ，浮動小数を格納するFPUレジスタ，SIMD命令で扱われるMMX/SSEレジスタなどがあります．このうち汎用レジスタが最低限必要なものです．汎用レジスタは8個あり，eax, ebx, ecx, edx, esi, edi, ebp, espと名前も役割も決まっています．当面はこの8個のレジスタのみを意識するだけで十分です．というか8個しかありません．通常の言語では変数名は自由につけられ，しかも好きなだけ使えるのとは大違いです．

インストラクションポインタ

CPUがまさに今実行しているアドレスです．命令を実行するごとに自動的に次の命令が格納されているアドレスを指すようになります．条件分岐や関数呼び出しなどはインストラクションポインタを変更することで実現されます．

スタック

メモリの一部は，スタック形式(FILO:最初に格納したものは最後に取り出せるデータ形)で扱われる領域として定義されおり，その部分を指します．主にC/C++における局所変数を扱うときに利用されます．スタック領域はある特定値(環境によって異なります)から0に向かう方向に伸びます．0になってしまうとスタックを使い切りスタックオーバーフローとなります．そのスタック領域の先頭アドレスは汎用レジスタespに格納されています(多分Extended Stack Pointerの略)．そのためスタックを操作するにはespを扱うことになります．

要はCPUがやっているのは，メモリをレジスタに読みこんで演算し，結果をメモリ/レジスタに格納する，結果によってインストラクションポインタを変更する．これだけです．アセンブリ言語で開発するということはこれらの手続きを一つ一つ丁寧に記述するということです．難しいのではなく，面倒なのですね．

さて，"Hello Xbyak!"を解説します．

    push((int)"Hello Xbyak!"); // (C1)
    call((int)puts); // (C2)
    add(esp, 4); // (C3)
    ret(); // (C4)

このプログラムはCでいうところの

void hello()
{
    puts("Hello Xbyak!");
}

と同じです(関数名は関係ないですがとりあえずhelloとします)．

C1.
C2.
C3.
C4.

コメント (1)

dsk:

(C2)をくりかえせばメッセージが複数回表示されますね。このあたりはアセンブラならではの技(という程ではないかもしれないけど)ですね（CやC++でも最適化で同様のコードになることもあるとは思いますが)。

投稿者: dsk | 2007年10月01日 21:13

日時: 2007年10月01日 21:13

コメントを投稿

(いままで、ここでコメントしたことがないときは、コメントを表示する前にこのブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)

名前:

メールアドレス:

URL:

この情報を登録しますか?

コメント: (スタイル用のHTMLタグが使えます)

mitsunari@cybozu labs

光成滋生@サイボウズ・ラボ（会社, 個人）