'Storage System' 카테고리의 글 목록 (2 Page)

Storage System

[NVMe] Spec 1.4 정리 - 2장 System BUS (PCI Express) Registers (2/?) 2020.01.14
[NVMe] Spec 1.4 정리 - 2장 System BUS (PCI Express) Registers (1/?) 2020.01.08
[NVMe] Spec 1.4 정리 - 1장 Introduction 2020.01.08
[SSD] 공부 할 만한 주제 2020.01.07
[SSD] SSD simulator 참조 2020.01.07
[NVMe] NVMe와 PCIe 관계 2020.01.07

[NVMe] Spec 1.4 정리 - 2장 System BUS (PCI Express) Registers (2/?)

2020. 1. 14. 00:13

PCI 버스에는 여러가지 장치가 물리는데 그 장치를 사용하려면, 각 장치가 어떤 것이고(identification), 어떻게 장치와 통신해야 하는지(protocol)를 알아야 한다. PCI 버스에서는 장치를 인식하고, 그 장치의 기본적인 정보를 얻어오기 위해 configuration space를 사용한다. 각 장치에 대해 할당된 configuration space를 통해 파악하게 되며 Device ID,Vendor ID,Status,Class code 등의 정보들이 해당 주소 공간에 저장되어 있다.

디바이스의 PCI configuration space 정보를 읽으면 디바이스와 통신을 하기 위한 기본적인 정보를 알 수 있다. PCI slot에 연결된 장치치에 대한 configuration space는 집적으로 읽을수 없다. 즉, OS가 부팅하면서 PCI에 연결된 모든 디바이스를 검색 해야 한다. 이때, PCI디바이스는 물리적으로 모든 디바이스에 bus, device, function 이라는 번호가 부여된다. 이 번호는 PCI slot에 따라 부여되는 것이기 때문에, 모든 bus, 모든 device, 모든 function을 스캔 해 보면, 컴퓨터에 달린 모든 디바이스 정보를 알 수 있다. 이 과정을 enumeration이라 한다

계속 공부를 진행하며 bus, device, function의 차이에 대해 궁금해졌다. 우리가 사용하는 PC에서 PCI slot에 장치를 연결한다면 해당 장치는 모두 다른 bus번호로 연결되는 것인지 등 어떤 디바이스들이 같은 bus를 공유하는지에 대해 궁금했다.

PCI address

Configuration Address Space

'Configuration Address Space’ has been defined to support PCI hardware configuration
'Configuration Address Space’ provides access to 256 bytes of special configuration registers per PCI device.
PCI Express introduces 'Extended Configuration Space‘ which extends the Configuration Space to 4096 bytes per Function
‘Configuration Read’ command and ‘Configuration Write’ command are used to transfer data between each ‘Configuration Address Space’ of PCI devices

Memory Address Space

‘Memory address space’ is used for burst transactions
Two different address formats are used: 32-bit address format and 64-bit address format
‘Memory Read’ command and ‘Memory Write’ command are used to transfer data in ‘Memory Address Space’

I/O Address Space

‘I/O address space’ is for compatibility with the x86 architecture's I/O port address space. Future revisions of PCI Express specification may deprecate the use of ‘I/O Address Space’
‘I/O Read’ command and ‘I/O Write’ command are used to transfer data in ‘I/O Address Space’.

Configuration Address Space

PCI devices have a set of registers referred to as 'Configuration Space‘
This configuration space is used for auto configuration of inserted PCI cards
Configuration Space registers are mapped to memory locations
PCI framework S/W should access the configuration space.

'Storage System' 카테고리의 다른 글

[NVMe] Spec 1.4 정리 - 3장 Controller Registers (0)	2020.01.16
[NVMe] Spec 1.4 정리 - 2장 System BUS (PCI Express) Registers (3/?) (0)	2020.01.16
[NVMe] Spec 1.4 정리 - 2장 System BUS (PCI Express) Registers (1/?) (0)	2020.01.08
[NVMe] Spec 1.4 정리 - 1장 Introduction (0)	2020.01.08
[SSD] 공부 할 만한 주제 (0)	2020.01.07

[NVMe] Spec 1.4 정리 - 2장 System BUS (PCI Express) Registers (1/?)

2020. 1. 8. 20:21

Ice Breaking PCIe interface (not included in spec)

2장이 시작되기 전 PCI 및 PCIe에 대한 기본적 지식이 필요함을 느껴 진행 한다.

참조 자료:

Peripheral Component Interconnect Bus (PCI)

위키백과
PCI 버스는 컴퓨터 메인보드에 주변 장치를 장착하는 데 쓰이는 컴퓨터 버스의 일종이다.
이 장치는 다음과 같이 두 가지 형태로 나뉜다.
1. 주기판 위에 바로 붙는 IC 형태 - PCI 스펙에서는 이러한 형태를 평면 장치(planar device)라고 부른다.
2. 소켓에 꽂아 쓰는 확장 카드 형태 - 사용자 입장에서 흔히 눈에 띄는 형태이다.내가 본 PCI의 경우 2번의 형태가 많았다. 주로 sound card, ethernet card 등을 꽂아 사용한다.

PCI 특징

PCI는 이전의 ISA, MCA, EISA, VESA 버스를 대체하기 위해 설계 되었다.

PCI는 아래의 특징을 가진다.

빠른 전송 속도
- 기존 bus들은 낮은 clock cycle (ISA: 4.7MHz, MCA: 10MHz, EISA: 8.3MHz, VESA: 33MHz)을 가진다.
- PCI는 33MHz부터 266MHz 이상의 clock cycle을 가져 데이터의 빠른 전송이 가능하다.
단일화된 인터페이스
- CPU와 PCI bus 사이에 system/PCI bus bridge를 설치해 여러 프로세서를 위한 설계가 가능하다.
- PCI bus에 PCI/Expansion bus bridge를 설치해 기존의 버스를 사용할 수 있다.
동시에 여러개의 function을 지원
- 같은 PCI bus상에 여러 bus master가 존재할 수 있다.
- 하나의 디바이스에 동시에 여러개의 function을 지원할 수 있다.

PCI Express (PCIe)

위키백과
PCIe는 앞서 언급한 버스 표준들과 비교하여 높은 시스템 버스 대역폭, 적은 I/O 핀 수, 적은 물리적 면적, 버스 장치들에게 더 뛰어난 성능 확장성, 상세한 오류 검출 및 보고 구조(Advanced Error Reporting (AER), 핫-플러그 기능등 여러 장점을 가지고 있다. 최근에는 하드웨어 I/O 가상화도 지원한다\

PCIe 특징

PCIe는 기본적으로 PCI가 가지는 성능적 한계 및 신호 왜곡 등을 개선하기 위해 기존의 병렬 bus로 구성된 PCI의 bus를 serial bus로 바꿔 설계했다. PCIe는 PCI 슬롯을 그대로 사용하며 여러개의 슬롯을 공유하지 않고 1:1로 연결해 사용한다. 따라서, 여러 장치를 붙일 경우 PCIe switch를 사용해 다수의 End device를 연결할 수 있도록 한다.

PCIe의 장점은 아래와 같다.

Bandwidth의 증가
Bus clock cycle의 증가
Bus width의 감소
회로의 단순화
PCI 디바이스 SW 호환성 유지

기본적으로 PCI는 병렬 bus를 이용하기 때문에 신호 왜곡에 취약하기 대문에 bus의 clock cycle을 올리기 어렵다. 이를 dual-simplex 방식의 serial bus로 바꿈으로써 bus width의 감소, clock cycle의 증가, 회로의 단순화 등의 장점을 가진다.

(참조: http://www.technoa.co.kr/news/articleView.html?idxno=38092)

PCIe Lane

Link

x1 ~ x32 lane을 하나로 묶어 사용할 수 있다.

1개의 Lane은 TX와 RX로 dual-simplex 구성으로 되어 있으며, 1개의link는 End-to-End Device간 1:1로 통신이 가능하다.

Dual-simplex

단 방향으로의 데이터 bus가 2개 1개 set로 구성되어, 하나의 bus는 데이터를 보내고 다른 하나의 bus는 데이터를 받는 것에만 사용된다. PCIe는 기본적으로 2개의 데이터 전달 통로(lane)을 갖는다.

*Full duplex도 존재 한다. 여러가지 방법이 존재 함.

PCIe Topology

위 그림은 PCIe를 통해 데이터를 전송하고자 하는 architecture의 topology를 나타낸다.

PCIe로 port를 연결하기 위해서는 기본적으로 Root Complex (RC)가 필요하다.

RC는 CPU와 PCIe bus들 사이의 interface를 말하며 CPU interface, DRAM interface 등 여러가지 구성요소와 여러 개의 칩들을 포함한다. RC의 위치는 CPU내 (구글링 검색 결과), 메인보드 Chipset 내에 존재 한다.

전체 fabric의 instance들은 다음 구성요소이다.

Root Complex
Multiple endpoints (I/O devices)
Switch
PCIe to PCI/PCI-X bridge

Switch의 경우 위 그림 처럼 PCIe slot을 여러개 확장해서 사용할수 있도록 한다.

PCIe Root Complex (RC)

RC는 Host CPU와 연결하기 위한 host bridge device와 secondary device 연결을 위한 PCIe port가 존재 한다.

Switch

Switch는 하나의 RC에 여러 디바이스를 붙일 수 있도록 만든 장치이다.
Swtich는 여러개의 Down-stream ports를 가지고 있지만 up-stream port는 하나만 존재 한다.
모든 활성화된 switch port는 flow control을 지원해야 한다. (Packet router처럼 동작하며, 해당 packet의 주소와 다른 routing 정보를 통해 어떤 경로로 packet이 가야하는지 인식한다.)

Endpoint Device

Endpoint device는 아래의 3가지 종류가 존재한다.
Legacy PCI endpoint
- Type 0 configuration header를 제공하는 function이여야 함
- I/O 요청 제공 및 발생 가능
- 4GB (32bit 주소 register일때) 주소를 초과하는 memory transaction 불가
- MSI/MSI-X를 지원
PCIe Endpoint
- Type 0 configuration space를 제공하는 function이여야 함
- I/O 요청 불가
- 4GB 주소 범위를 넘는 memory transaction 가능 (64bit addressing 가능)
- MSI/MSI-X 지원
Root Complex integrated endpoint
- Type 0 configuration space를 제공하는 function이여야 함
- Root complex 내부 로직에 구현된 root port
- I/O 요청 불가
- 전원 관리 구현 X
- Hot plug 지원 X
- MSI/MSI-X 지원
- 32bit BAR를 통해 memory resource를 지원 (End-point device의 BAR와 비교한 결과 존재)

PCIe 계층 구조 및 데이터 전송

PCI 전송에는 3개(Transaction layer, Data link layer, Physical layer)의 layer가 필요하다.

PCI -> PCIe 변화 (paralle bus -> serial bus)로 변경되는 부분은 Transaction, Data Link, Physical 계층이다.

아래는 데이터의 전송 과정을 요약했다.

Transaction layer에서는 packet 단위의 전송을 위해 데이터 packet을 형성하고 이를 Link layer로 전달한다.
Link layer에서 데이터의 신뢰도를 위한 CRC 코드를 전달 받은 데이터에 삽입한다.
Physical layer에서 frame 붙여 데이터를 추가 후 8b/10b 인코딩을 해 데이터를 전송하기 위해 serialized data로 변환한다.

Transaction layer에서 생성된 데이터 packet은 header와 data로 구성되어 있다. 해당 packet이 Data link layer로 전달되고 Data link layer에서 packet의 순서를 정한 번호와 CRC코드가 앞뒤로 붙게 된다. 그리고 Physical layer로 도착한 데이터에 대해 앞뒤로 frame을 붙이고 해당 packet을 serialize하며 이때 8b/10b 인코딩 시키면 PCIe bus를 통해 데이터를 전달하게 된다. 하지만 이것은 PCIe Gen 1 기준으로 나타냈다. Gen 3만 보더라도 encoding scheme이 128b/130b로 늘어났기 때문이다. 전송되는 packet의 구성과 크기는 아래와 같다.

Physical Layer
- Framing
  - Start (1B)
  - End (1B)
Data Link Layer
- Sequence Number (2B)
- LCRC (1DW)
Transaction Layer
- Header (3~4DW)
- Data (0~1024DW)
- ECRC (1DW)

Transaction Layer

Ttransaction layer에 발생되는 packet을 Transaction Layer Packets (TLP)라 부른다. TLP는 routing mechanism 및 규칙에 따라 하나의 링크에서 다른 링크로 전달된다. 아래는 TLP가 접근하는 4개의 address spcae를 말한다. 즉, PCIe 디바이스에서 packets이 전달될때 아래의 분리된 주소 공간이 사용된다. (TLP header를 통해 구분한다)

Memory
- Transaction types: Read, Write
- Purpose: transfter data to or from a location in the system memory map
I/O
- Transaction types: Read, Write
- Purpose: Transfer data to or from a location in the system IO map
Configuration
- Transaction types: Read, Write
- Purpose: Transfer data to or from a location in the configuration space of a PIC-compatible device
Message
- Transaction types: baseline, vendor-specific
- Purpose: general in-band messaging and even reporting without consuming memory or IO address resoures

Data Link Layer

링크 트레이닝
- 링크 폭
- 링크 데이터 rate
- Lane reversal (Lane 역 방향 순서 지원)
- Polarity inversion (극성 반대 지원)
- 멀티 레인에서 레인 to 레인 de‐skew
전원 관리
- 트랜잭션 게층에서 요청한 전원 상태를 수락하고 물리 계층으로 전달한다.
- 활성/재설정/연결 해제/전원 관리 상태를 트랜잭션 계층으로 전달한다.
데이터 프로텍션, 에러 체킹
- CRC 생성
- 에러 체킹
- 재전송 메시리지대한 TLP 응답
- 에러 리포팅 및 로깅을 위한 에러 인디케이션

Physical Layer

인터페이스 초기화, 메인트넌스 제어 및 스테이터스 트래킹
- 리셋/핫플러그 컨트롤
- 전원 관리 인터커넥트
- width & lane 매핑 협상
- lane 극성 반전
심볼 및 오더
- 8b/10b 엔코딩 및 디코딩
- 임베디드 클럭 튜닝 및 정렬
심볼 전송 및 정렬
- 전송 회로
- 리셉션 회로
- 수신 측 Elastic 버퍼
- 수신 측 멀티 lane de-skew

'Storage System' 카테고리의 다른 글

[NVMe] Spec 1.4 정리 - 2장 System BUS (PCI Express) Registers (3/?) (0)	2020.01.16
[NVMe] Spec 1.4 정리 - 2장 System BUS (PCI Express) Registers (2/?) (0)	2020.01.14
[NVMe] Spec 1.4 정리 - 1장 Introduction (0)	2020.01.08
[SSD] 공부 할 만한 주제 (0)	2020.01.07
[SSD] SSD simulator 참조 (0)	2020.01.07

[NVMe] Spec 1.4 정리 - 1장 Introduction

2020. 1. 8. 01:45

1.1 Overview

NVMe interface는 host software가 non-volatile memory subsystem와 통신할 수 있도록 해준다.

NVMe는 PCIe interface를 사용하는 enterprise와 client SSD에 최적화되어 있다.

1.2 Scope

해당 spec은 NVM subsystem의 controller와 register interface를 정의한다.

세 종류의 Controller가 존재한다.

I/O controllers
Discovery controllers
Administrative controllers

1.3 Outside of scope

1.4 Theory of Operation

NVMe Interface는 최적화된 command submission과 completion paths를 제공한다.

Key attributes

command submission 또는 completion path에서 uncacheable/MMIO register read가 필요하지 않다.
command submmision path에서 최대 하나의 MMIO register wrtie가 필요하다.
최대 64K I/O queue 지원과 각 I/O queue는 64K개의 outstanding commands가 가능하다.
각 I/O queue와 관련된 priority는 well-defined arbitration mechanism으로 조정 된다.
4KB read 요청을 완료하기 위한 모든 정보는 64B command에 포함된다.
효율적이고 streamlined command set을 가진다.
MSI / MSI-X와 interrupt 지원한다.
Multiple namespaces 지원한다.
SR-IOV처럼 효율적인 I/O virtualization을 지원한다.
Robust error reporting과 management capabilities
Multi path I/O와 namespace sharing을 지원한다.

NVMe controller는 single PCI function과 연관된다.

전체 controller에 적용되는 capabilities와 설정들은 Controller Capabilities (CAP) 레지스터와 Identify Controller data structure를 나타낸다.

하나의 namespace는 logical block으로 format된 non-volatile memory의 quantity이다.

NVMe controller는 namespace ID를 가지는 multiple namspaces를 지원한다.

Namspaces는 Namespace Management와 Namespace Attachment commands로 생성과 삭제가 된다.

Identify Namespace data structure는 특정 namespace의 capabilities와 설정을 나타낸다.

NVMe interface는 submission과 completion queue의 pair 형태를 기반으로 한다.

Commands는 host software에 의해 submission queue에 issue 된다.

Completions는 controller에 의해 completion queue에 issue 된다.

Multiple submiision queues는 동일한 completion queue를 이용한다.

Submission과 complition queues는 메모리에 할당 된다.

Admin submission과 이와 관련된 completion queeu는 controller 관리, I/O submission과 completion queues들의 생성과 삭제 및 aborting commands 등 control 목적을 위해 존재한다.

I/O command set은 I./O queue pair로 사용된다.

해당 spec에서는 I/O command set을 NVM command set으로 명시한다.

Queue pair

Host software는 controller가 지원하는 최대 개수의 queue를 생성한다.
queue 생성은 system configuration과 anticipated workload에 기반한다.
queue 생성의 종류는 1:1 mapping, n:1 mapping이 존재 한다.

Submission Queue와 Completion Queue를 이용한 I/O 처리 과정

Submission Queue (SQ)는 host software가 controller에 의해 실행되기 위한 commands를 전달하기 위한 고정된 크기의 circular buffer이다
실행되어야 할 1~n개의 새로운 commands이 있다면 host software는 적절한 SQ Tail doorbell 레지스터를 업데이트 한다.
새로운 doorbell resister write가 있을때 이전의 SQ tail 값을 덮어 쓰기한다.
Controller는 SQ entries을 SQ에서 순차적으로 fetch하고 어떤 순서로(알고리즘에 기반) 실행한다.
각 SQ entry는 command이고 64B의 크기를 가진다.
메모리내 Physical 메모리는 data 전송을 위해 사용되며, Phsical Region Page (PRP) entries 또는 Scatter Gather Lists가 나타낸다.
각 command는 두개의 PRP entires 또는 하나의 SGL segment를 포함한다.
만약 data buffer를 위해 두개 이상의 PRP entires가 필요하다면, PRP Lists의 pointer가 PRP entires를 가리킨다.
위와 동일하게 하나 이상의 SGL이 필요한 경우, SGL semgment는 다음 SGL segment pointer를 제공한다.
Completion Queue (CQ)는 completed command의 상태를 나타내기 위한 고정된 크기의 circular buffer이다.
Completed command는 host software에서 할당된 SQ identifier와 comand identifier의 조합으로 식별된다.
Multiple SQ는 하나의 CQ를 사용한다.

Multi-Path I/O and Namespace Sharing

Multi path I/O는 하나의 host와 하나의 namespace 사이간에 두개 이상의 독립된 path를 말한다.
반면에 namespace sharing은 두개이상의 host가 다른 NVM controller를 사용하는 shared namespace에 접근하는 것을 말한다.

1.5 Conventions

Abbreviations

RO : Read Only
RW : Read Write
R/W : Read Write. The value read may not be the last value written.
RWC : Read/Write '1' to clear
RWS : Read/Write '1' to set
Impl Spec : Implementation Spec
HwInit : The default state is dependent on NVMe controller and system configuration
Reset : This column indicates the value of the field after a reset

Use a '0's based value

1.6 Definitions

Admin queue

identifier 0을 가지는 SQ와 CQ이다.
administrative commnad를 submit하고 completions을 받기 위해 admin SQ와 admin CQ는 pair를 이룬다.

Administrative controller

Host가 NVM subsystem을 관리할수 있도록 capabilities를 가지고 있는 controller
해당 controller는 I/O queues를 가지지 않는다.
Logical blocks과 관련된 metadata 또는 data에 대한 접근을 제공한다.
namespaces를 지원한다.

Arbitration burst

Round robin 또는 weighted round robin을 사용하는 SQ로부터 한번에 처리 가능한 commands의 최대 수를 말한다.

Arbitration mechanism

SQ에서 Controller에 의해 수행되기 위한 command를 결정하기 위해 사용 된다.

Cache

NVM subsystem을 사용하는 data storage area

Command completion

Controller가 command를 처리한 command
처리 결과 상태는 completion queue entry에 업데이트 된다.

Command submission

Command는 SQ Tail doorbell write는 처리되었을때 submmit 된다.

Controller

Types
- I/O controllers
- Discovery controllers
- Administrative controllers
Controller는 host에 의해 SQ에 submmit된 commands를 실행하고 completion queue에 completion을 업로드 한다.
각 controller는 하나의 admin SQ와 하나의 admin CQ를 가진다.
Controller에 따라 하나 이상의 I/O queues를 가질수 있다.

directive

host와 NVM subsystem 또는 controller 정보를 교환하는 방법이다.
정보는 Directive Send와 Directive Receive commands를 통해 전달된다.
I/O commands의 subset은 I/O command와 관련된 정보를 통신하기 위해 Directive Type field와 Directive Specfic field를 포함한다.

Discovery controller

Host가 Discovery Log Page 정보를 받을수 있도록 하는 특성을 가진 controller이다.
I/O queues를 가지지 않는다.

Emulated controller

Software에 정의된 NVMe controller이다.

Endurance Group

NVM subsystem내 NVM 중 일부이다.
Group 으로 endurance가 관리된다.

extended LBA

연속적인 LBA 전송과 관련된 memta가 전송될때 생성된다.

firmware slot

NVM subsystem내에서 firmware image를 저장하기 위해 사용되는 슬롯이다.
NVM subsystem은 1~7개 firmware images를 저장할 수 있다.

I/O completion queue

I/O completion queue는 completion queue이다.
하나 이상의 SQ와 연관되며, I/O CQ identifiers는 64K까지 값을 가진다.

I/O submission queue

I/O submission queue는 SQ이다.
Controller에 의해 실행하기 위한 I/O command를 SQ에 submit한다.

I/O controller

I/O queues를 가지는 controller이다.
NVM storage를 접근하기 위해 사용된다.

LBA range

연속적인 logical blocks의 범위이다.

Logical block

가잔 작은 접근 가능한 data 단위이다.

Logical block address (LBA)

Logical block의 주소이다.

metadata

특정 LBA 데이터에 대한 정보이다.

primary controller

Virtualization Management command를 지원하는 NVMe controller이다.

'Storage System' 카테고리의 다른 글

[NVMe] Spec 1.4 정리 - 2장 System BUS (PCI Express) Registers (2/?) (0)	2020.01.14
[NVMe] Spec 1.4 정리 - 2장 System BUS (PCI Express) Registers (1/?) (0)	2020.01.08
[SSD] 공부 할 만한 주제 (0)	2020.01.07
[SSD] SSD simulator 참조 (0)	2020.01.07
[NVMe] NVMe와 PCIe 관계 (0)	2020.01.07

[SSD] 공부 할 만한 주제

2020. 1. 7. 08:03

참조: http://esos.hanyang.ac.kr/?page_id=13347

http://esos.hanyang.ac.kr/?page_id=15843

주제 1. 리눅스의 대용량 메모리 관리 기법 분석

현재 PC 시장에서 DRAM 메모리의 용량은 크게 증가되었으며, 메모리 집적화 기술의 고도화로 인해 대용량 서버 환경에서는 TB 단위의 메모리까지 등장하게 되었다. 하지만 이와 같은 물리 메모리의 증가는 CPU의 하드웨어 캐시인 TLB(Translation Look-aside Buffer)의 잦은 Miss를 통해 전체적인 메모리 작업의 성능을 하락시키는 문제를 발생시켰다. 때문에 리눅스에서는 하나의 페이지의 크기를 2MB, 1GB까지 확장하도록 지원하는THP(Transparent Huge Page)기법을 제공한다. THP 기법은 하나의 TLB에서 관리할 수 있는 페이지의 크기를 늘려, 기존의 TLB로도 효율적으로 대용량 메모리를 관리할 수 있도록 하는 장점이 있다. 하지만, THP 기법은 비효율적인 메모리 할당 정책 및 페이지 할당에 걸리는 시간이 매우 크다는 단점이 존재하기에 아직 완벽한 기법이 아니다. 본 프로젝트에서는 이러한 리눅스의 THP 기법을 코드 단위로 분석하여 그 동작 방식을 이해하며, 대용량 메모리 경에서의 THP 기법 사용의 장단점을 분석한다. 본 프로젝트는 분석을 위해 Sysbench, Cloudstone, Redis, MongoDB 등 DB환경에서의 성능 분석 툴을 사용하여 Buffered I/O의 지연 시간 및 물리 메모리 사용량을 측정한다. 이러한 분석과정을 통해 리눅스에서 THP 기법의 동작 방식에 대한 장단점 파악 및 개선 방안을 고안한다. 본 프로젝트는 리눅스의 물리 메모리 관리 기법에 대한 이해를 우선할 수 있음은 물론, 리눅스 기반 대용량 메모리 시스템에 최적화 된 메모리 관리 방식을 설계하는 것을 목표로 한다.

프로젝트 완성도 : 최종 보고서, 발표 자료, 소스코드, Transparent Huge Page 개선 방안 등