日本語入力について

1.文字コードと半角、全角
文字コード表とは文字を数値に対応づけた表で、基本はISOコード(ASCII)である。これは、
1バイト(8ビット)コードであるが、最上位の8ビット目は使わない。従って、10進数で127以下である。文字コードは、a,b,c..という文字情報だけをもっており、その形や太さ、大きさなどの属性情報は持っていない。1バイトコードで表せる文字を半角文字といい、縦横比が2:1である。
一方、日本語は文字の数が多くて、1バイトではとても表せないので、2バイトを使って1文字を表す。このコードは縦横比が2:2で全角文字という。このコードは組み合わせによって3(4)種類のコードが使われている。
JISコード:2つのISOコードを組み合わせる(7ビットコードを2つ)JIS-x-0208
シフトJIS:ISOコードと重ならないように、8ビットコードを2つ
EUCコード:ISOコードと区別するために、2バイトコードはJIS-x-0208+128
これらのコードは、16ビット(2バイト)を4つの16進数で表現する。
16進数は4桁の2進数で表現するので、最大桁<1111>は10進数で15になる。
10進数の10から15までを、AからFで表現する。したがって、
JISコードの最上位の桁は8にはならないし、シフトJISは8以上になる。
例:
愛:jis:00110000-00100110 3026
sjis:10001000-10100010 88A4

2.フォント、ポイント、文字飾り、文字位置、True Type Font
フォントとは、文字の書体のことで、"courier"、"MS明朝"、"HG正楷書体"など、名前をもっている。
ポイント数は文字の大きさ(高さ)をきめる単位で、1ポイントは1/72インチ(約0.35mm)
文字飾りには、太字、斜体、袋文字、下線付き、取り消し線などがあり、さらに色をつけて強調することもある。
文字位置は、10やHOのように周りの文字列より上、または下に配置する。
その他、フォントには文字間隔を活字(iやm)によって自動的に調整する、プロポーショナルフォントや一定の間隔で印字する固定幅フォントがある。

3.True Type Font(アウトラインフォント)
活字情報を固定的なドット構成の形で持っているフォント以外に、2次元の座標情報(ベクトル情報)として持ち、出力時に 描画するフォントをTrueType Fontという。
この方式だと、情報量は少なく、大きさも自由に変えられ(通常は0.5ポイント間隔)、滑らかな印字が実現出来る。

4.LINUXでの日本語入力
editorなどを起動して、文字入力の準備が完了したしてところで、shiftキーとspaceキーを同時に押すとカーソル下に「あ」という字がでる。この状態が通常のローマ字ひらがな漢字変換モードである。ここで、ローマ字を入力すればひらがなに変わり、spaceキーを押せば適当な漢字に変換される。
連文節変換の場合
   単語/文節間の移動:[Ctrl]-[f]または[→]で 次の文節へ
 [Ctrl]-[b]または[←]で 前の文節へ
   単語/文節の区切りの変更:[Ctrl]-[o],[Shift]-[→]で範囲を広げる
[Ctrl]-[i],[Shift]-[[←]で範囲を狭める