キャッシュ英語: cache)は、CPUバスネットワークデータベースGPUDSPなどにおいて、情報を転送する際、転送効率を向上するための記憶階層の実現手段である[要出典]ハードウェアの形態とソフトウェアの形態がある。

キャッシュ概要図

転送元と転送先の中間に位置し、データ内容の一部とその参照を保持する。

参照が既にキャッシュに格納されているデータが転送要求されたとき、転送元ではなくキャッシュが転送を代行する。これをキャッシュヒットという。所望のデータがキャッシュに存在せず元データから転送する状態をキャッシュミスという。由来は不明で和製英語と思われるが、日本の一部の文献及び資格試験において「キャッシュミスヒット」という用語が使われている。

もしくは、データを滞留させてデータ粒度を高める機能を持つ。これらにより、データの時間的局所性空間的局所性を活用し、データ転送冗長性オーバヘッドを低減させることで、転送効率を向上させる。

基本概念

編集

記憶階層 (Memory Hierarchy)

編集
記憶階層の例

データを保持する記憶装置の理想は大容量×高速アクセスであるが、通常コストパフォーマンスが悪く実現困難である。そのため、小容量×高速、中容量×中速、大容量×低速など複数段階にまたがった記憶構造とすることが多い。また一般に、CPUなどバスマスタに近い側を上位レベル、遠い側を下位レベルとし、各レベルを各々下位レベルの一時記憶として用いる。この構造を記憶階層という。

小容量×高速の代表はCPUレジスタであり、大容量×低速記憶装置の代表はハードディスク磁気テープなどの補助記憶装置である。

記憶階層のうちキャッシュに該当する、L1キャッシュとL2キャッシュについて、上位のL1キャッシュに存在するデータが下位のL2キャッシュにもデータが存在する方式(インクルージョンキャッシュ)と、上位のL1キャッシュに存在するデータが下位のL2キャッシュに必ずしもデータが存在しない方式(ビクティムキャッシュ)がある。

局所性 (Locality)

編集

時間的局所性 (Temporal Locality)

編集

データの再利用率とその時間的特性を示す言葉。ある領域のデータ転送が行われて、同一データの転送が再度、近い時間内に行われている場合を時間的局所性があるという。CPUにおける命令キャッシュや、ウェブブラウザなどにおけるファイル単位のデータ保持などは、転送が行われた近い期間にループや戻るボタンなどによる再転送要求を期待して、アクセスがあったデータをある程度後まで保持しておく。逆に音声のようなストリームデータなどは時間的局所性はあまりなく、下記にある空間的局所性に頼った効率化を図る必要がある。

空間的局所性 (Spatial Locality)

編集

データの格納位置に対する偏在性を示す言葉。ある領域のデータ転送が行われて、近い時間内に、連続ないし近傍領域のデータ転送が行われている場合を空間的局所性があるという。真にランダムに転送されるべきデータというのは少なく、大抵のデータには空間的局所性が存在する。一般的にデータ転送でスループットよりレイテンシ、すなわちデータ転送帯域より転送距離が問題となる場合は、小さなデータを何度も転送するよりも少ない回数でより多くのデータを転送することで効率向上する場合が多い。従って転送元は空間的局所性を期待して未要求の近傍データも同時に送り、キャッシュにより未要求データを保持することで、キャッシュ下位レベルとの転送セット回数を削減しようとする。CPUキャッシュメモリのラインサイズは、この空間的局所性に鑑みて決定される。

歴史

編集
  • 1961年 マンチェスタ大学Tom Kilburnらが開発中のコンピュータAtlasに仮想記憶機構を搭載
  • 1962年 Kilburnらが論文"One-level storage system"を発表
  • 1965年 ケンブリッジ大学M. V. Wilkesがキャッシュに関する最初の論文"Slave Memories and Dynamic Storage Allocation"を発表(論文ではキャッシュをスレーブメモリと呼んだ)
  • 1965年 ケンブリッジ大学でGordon Scarrottがダイレクトマップ方式の命令キャッシュを実装
  • 1967年 最初のキャッシュ搭載商用マシンIBM System/360 Model 85が完成(16-32KB, 80-160ns)。1968年発売
  • 1968年 IBMのDonald H. GibsonらがIBM System/360 Model 85の性能評価に関する論文"Structural Aspects of the System/360 Model 85 I: General Organization."を発表。そのなかで初めてキャッシュという用語が使用された

参考文献

編集
  • ジョン・L・ヘネシー / デイビッド・A・パターソン著、富田眞冶 / 村上和彰 / 新實治男訳、『コンピュータ・アーキテクチャ 設計・実現・評価の定量的アプローチ』、日経BP社、ISBN 4-8222-7152-8
  • デイビッド・A・パターソン / ジョン・L・ヘネシー著、成田光彰訳、『コンピュータの構成と設計 ハードウエアとソフトウエアのインタフェース 第2版(上/下)』、日経BP社、ISBN 4-8222-8056-X / ISBN 4-8222-8057-8
  • 山崎傑著、『オペレーティング・システムの基礎』、CQ出版社、ISBN 4-7898-3668-1
  • 中森章著、『マイクロプロセッサ・アーキテクチャ入門 RISCプロセッサの基礎から最新プロセッサのしくみまで TECHI Vol.20』、CQ出版社、ISBN 4-7898-3331-3

関連項目

編集

📚 Artikel Terkait di Wikipedia

キャッシュメモリ

キャッシュメモリ (cache memory) は、CPUなど処理装置がデータや命令などの情報を取得/更新する際に主記憶装置やバスなどの遅延/低帯域を隠蔽し、処理装置と記憶装置の性能差を埋めるために用いる高速小容量メモリのことである。略してキャッシュとも呼ぶ。コンピュータは以前から記憶装置や伝送路

Intel486

mask) ビットを適切にセットしておく必要がある。 CR0・CR3レジスタのいくつかのビットには機能が追加された。 CD (Cache disable) - CR0の第30ビット。CPUキャッシュを無効化。 NW (Not write-through) - CR0の第29ビット。キャッシュのライトスルー機能などを無効化。

Ryzen

V-Cache搭載のCPUは後から発表された。計画当初は、2024年7月末に発売される予定であったが、品質管理上の理由から8月上旬に延期となった。前世代との最大の違いはCCDのプロセスルールがTSMC 5nmからTSMC 4nmへ変更された。フロントエンドでは、デコーダとOp Cache

Power Macintosh 6100

8100の3機種以降、IBMが開発したPower Architectureを基本にApple・IBM・モトローラの3社の技術提携によって開発されたPowerPC 601プロセッサをCPUとして搭載するように変更された。 本機種はPower Macintoshシリーズ初代機3機種の中でもローエンドのエントリーモデルに位置づけられた。Macintosh

Compute Express Link

CPU-デバイス間およびCPU-メモリ間を高速に接続するためのオープンスタンダードである。 CXLは、PCI Express(PCIe)の物理的・電気的インターフェイス上に構築されており、PCIeベースのブロック入出力プロトコル(CXL.io)、システムメモリ(CXL.cache)およびデバイスメモリ(英語版)(CXL

GPU

細化が鈍化していることからムーアの法則は限界に達しつつあるが、設計が複雑で並列化の難しいCPUと比較して、個々の演算器の設計が単純で並列計算に特化したGPUは微細化の恩恵を得やすい。さらにHPC分野では、CPUよりも並列演算性能にすぐれたGPUのハードウェアを、より一般的な計算に活用する「GPGP

オンボードグラフィック

を用いた Display Cache をサポートした。 なお、いずれの場合でもDisplay Cache はあくまでZバッファ専用であるため、2D性能の向上にはまったく寄与しない。 Local Frame Buffer(以下LFB)は上述の Display Cache

Intel A100

with 512-KB L2 Cache Datasheet” (PDF) (英語). インテル (2008年1月19日). 2009年2月5日時点のオリジナルよりアーカイブ。2008年4月5日閲覧。 ^ “後藤弘茂のWeekly海外ニュース もう1つの超低消費電力CPU「Silverthorne」”