Linux의 thread local storage 파헤치기

Notice

LLVM 관련 잡일 의뢰 받습니다.

Recent Posts

Recent Comments

Link

« 2025/03 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Tags more

Archives

Today

Total

관리 메뉴

Why should I know this?

Linux의 thread local storage 파헤치기 본문

Knowledge/Linux

Linux의 thread local storage 파헤치기

die4taoam 2019. 1. 17. 16:37

Thread Local Storage 파헤치기

0. 개요

Thread Local Storage는 Multi-Thread 프로그램을 작성하는데 거의 필수로 사용되는 기능이다.

Linux에서의 Thread Local Storage에 대하 자세히 다뤄보고자 한다.

이 글에서 다루는 모든 소스코드와 예제는 github 저장소에 존재한다.

https://github.com/ParkHanbum/study_tls.git

0-0. 배경

-. 프로그래밍 공학시간에 배웠듯, 프로그래밍 언어에서 지역변수는 Stack에, 전역변수는 Data 영역에 보관된다.

-. 모든 프로세스에는 아키텍처에 가용한 최대한의 메모리가 가상 메모리로 제공된다. 이것을 Flat 혹은 Linear 메모리 모델이라고 부른다.

0-1. Thread 란?

먼저 Thread를 간단히 정의하자면, Process가 자원 할당의 단위라고 한다면 Thread는 작업 처리의 단위이다.

0-2. Thread Local Storage(TLS)

메모리의 할당은 Process 단위로 이뤄지게 되는데, 이런 구조 상에서 Thread는 동일한 메모리 주소를 공유하게 된다. Thread가 한 Process 하에서 동일 메모리를 공유하기 때문에 Thread 들은 Data 영역을 공유하게 된다. 이것을 다른 말로 표현하면 Process의 전역 변수는 모든 Thread가 공유하게 되는 것이다.

하지만 Process와 마찬가지로 Thread들도 각자의 고유한 전역변수가 필요한 경우가 있을 것이다. 때문에 Stack과 마찬가지로 Thread 별로 Data 영역처럼 고유의 영역을 제공하는데, 이를 Thread Local Storage(=이하 TLS)라고 부른다.

1. TLS에 사용되는 네 개의 모델

TLS에 사용되는 네 개의 모델을 순서대로 살펴보기 전에, 먼저 TLS가 생성되는 기본 메커니즘을 알아야 한다. linux에서는 __thread 와 같은 키워드를 사용하여 TLS 변수를 선언할 수 있다.

초기화 된 전역 변수가 .bss 섹션에, 초기화 되지 않는 전역 변수가 .data 섹션에 저장되는 것처럼, TLS 변수는 각각 .tbss, .tdata 섹션에 저장된다.

하지만 전역변수와는 다르게 TLS 변수는 thread 별로 고유하게 할당되는 것이 목적이므로 TLS 변수는 Section에 바로 할당되지 않고 Loader에 의해 적재되는 런타임에 주소가 정해지게 되며, 이 때 비로소 메모리에 할당 & 복사된다.

이 차이를 유념하도록 하자

1-1. Local Exec

실행파일의 경우, Linking 시에 정적으로 할당되는 TLS 주소를 계산할 수 있다.

로더는 Thread를 관리하기 위한 구조체 struct pthread의 주소를 FS레지스터에 기록해논다. struct pthread 구조체는 glibc의 nptl/descr.h 에 선언되어 있다.

여기서는 TCB(Thread Control Block)으로 줄여 부르고자 한다.

로더는 TCB를 위한 메모리를 할당하면서 동시에 실행 전에 필요한 모든 TLS 공간을 메모리에 할당&복사하는 과정을 통해 실행을 준비를 한다. Local Exec 모델의 경우 TLS가 할당되는 위치가 TCB 주소에서 상대적으로 항상 고정되기 때문에 TCB의 주소를 기반으로 정적 참조가 가능하다.

github에서 받은 저장소에서 make를 실행하면 readtlsinfo라는 실행파일이 생성될 것이다. 이를 실행해보면 다음과 같은 결과를 볼 수 있다.

TLS variable address : 0x7f434e946b68

tcb : 0x7f434e946b80

dtv : 0x7f434e9474d0

위는 다음 코드를 실행한 결과이다.

struct tls *test = &find_me;

printf("Print DTV information after refer tls variable\n");

printf("TLS variable address : %p\n", test);

TLS 변수인 test는TCB의 주소에서 24를 뺀 주소에 위치하는 것을 알 수 있다. 이 주소가 항상 고정되어 있다는 것을 기계어 코드를 보면 확인할 수 있다.

0x00000000004012ef <+84>: mov %fs:0x0,%rax

0x00000000004012f8 <+93>: add $0xffffffffffffffe8,%rax

0x00000000004012fe <+99>: mov %rax,-0x10(%rbp)

0x0000000000401302 <+103>: mov $0x4015e8,%edi

0x0000000000401307 <+108>: callq 0x400a10 <puts@plt>

FS+0이 TCB의 주소이므로 TCB 주소에서 -24 된 주소를 출력해주도록 기계어가 생성되어 있는 것을 확인할 수 있다.

Local Exec model 정리

-. 실행파일의 TLS는 고정된 위치에 적재된다.

-. 실행파일의 TLS는 TCB 주소 기반으로 고정위치에 정해진다.

-. 컴파일러는 TCB를 기반으로 고정된 위치를 참조하도록 기계어를 생성한다.

1-2. Initial Exec

앞서 Local Exec Model에서 실행파일의 TLS가 고정된 위치에 적재된다고 설명한 바 있다. 로더는 TLS 영역을 할당하고 가장 먼저는 TCB에서 Fixed offset에 실행파일의 TLS을 복사한다. 여기서 로더가 고정적으로 할당하는 메모리 영역을 Static TLS Block이라고 부른다.

Initial Exec model은 Local Exec model처럼 Static TLS Block에 복사되고, 별도의 메모리를 할당받지 않는다. 해당 모델은 주로 glibc와 같은 실행파일이 실행되는데 필수적으로 필요한 의존성 공유 오브젝트들이 사용하게 된다.

우리에게 친숙한 errno 이 해당 model을 사용한다.

실행파일과는 다르게 이 model에서 할당되는 메모리 공간은 Runtime에 결정되므로 Local Exec model처럼 Linking시에 참조할 주소를 결정할 수 없다. 때문에 로더가 최종적으로 할당한 Static TLS Block의 주소 값을 약속된 공간인 GOT에 기록하도록 약속하고 컴파일러는 GOT에서 주소를 참조하는 방식을 취한다.

Make를 실행했다면, bench_tls 라는 이름의 실행파일이 생겼을 것이다. ldd로 의존성을 확인하면 다음과 같은 결과를 볼 수 있다.

$ ldd bench_tls

linux-vdso.so.1 (0x00007ffdfd322000)

libtls.so => not found

libpthread.so.0 => /lib/x86_64-linux-gnu/libpthread.so.0 (0x00007f6fa9d04000)

libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f6fa9913000)

/lib64/ld-linux-x86-64.so.2 (0x00007f6fa9f23000)

libtls.so가 존재하지만, library path에서 찾을 수 없기 때문에 libtls.so가 not found로 나온다. 때문에 다음의 명령을 실행해야 한다.

$ export LD_LIBRARY_PATH=`pwd`

이제 정상적으로 library를 찾을 수 있을 테니, bench_tls를 실행해보자.

$ ./bench_tls

[1770555136] 0x7f1a698886fc = 500001