🔐

시스템 보안 - Shell Code

태그

수업CS정리

완료 일시

May 13, 2024

개요(수업 복기)

오늘(5/7) 수업에서 기존 쉘 코드들이 왜 실행되지 않았는지 다뤘다.(Segmentation Fault)

처음에 만든 쉘 코드는 주소가 상수로 박혀있어서 실패했다.

💡

복습하기

수업 중 shellcode 변수는 어디에 저장되는지에 대해 교수님이 질문했다.

그런데 순간 생각이 나지 않았고, “일단 문자열이니까 .rodata에 있겠지” 같은 생각을 하고 있었다.

1주일 후에 또 시험인데 X됐다고 볼 수 있다.

오케이 복습 완료. char shellcode[] 는 전역 배열이기 때문에 data 영역에 초기화 되어 저장되는 것이 맞다.

복습 차원에서 몇가지 예시를 들어보면:

char* shellcode = “asdf” 였다면 asdf는 .rodata에 저장되었을 것이다.

또한 포인터 변수 shellcode 자체는 .data에 저장되어 있을 것이다.

char shellcode[] = “asdf”가 로컬 배열이었다면, stack에 저장되었을 것이다.

두번째는 실행은 되었지만 널로 인해 동작이 일관성이 없을 수 있어서 추가적인 정리가 필요했다.

코드 내의 null bytes를 어디 다른데서 얻을 수 있는 null로 대체하는 작업이었다.

이렇게 해서 쉘 코드 집어넣고 실행되었다.

이걸 잘 exploiting하면 특정 파일을 실행했을 때, rm -rf ~ 같은 명령어를 시스템콜로 호출 가능할것이다.

rm -rf / 은 sudo 권한이 없어서 안될까?

어쨌든 시스템 콜은 커널 영역에서 실행될텐데 말이다.

환경 구축하기

그동안 32비트 시스템이 없어서 못해보고, 맨날 고민만 했다.

대 AMD64, ARM64 시대에 어디서 x86 시스템을 구하나?

집에 걸어가다가 fail fast라는 개념이 생각났다.

복구 비용이 적을 때 빨리 실패하고 그 결과에서 빨리 피드백하라는 것이다.

잊고 있었는데 사실 테스트 코드, 테스트 코드를 넘어 ‘테스트 자체’의 목적 중 하나가 fail fast였다.
코드를 최대한 프로덕션 환경과 가깝게 하고, 의도대로 잘 수행되는지 fail fast하게 검증하는 것이다.

그래서 나도 failfast 정신에 입각해 AMD64 시스템을 구해(AWS EC2), 일단 실행해보기로 했다.

생각해보면 x86_64 = AMD64 = “IA-32 Extended” 이며, 어쨌든 32비트 하위호환성을 가진다.

자세한 건 모르지만 어쨌든 호환되겠거니 싶었다.

‣

환경 구축(처음부터)

‣

Dockerfile

시스템 콜 호출 어셈 분석하기

먼저 execve 시스템콜을 호출하는 프로그램을 작성하고, 컴파일 한 후 어셈블리를 본다.

‣

왜 정적 컴파일을 해야 하는가?

main 함수

libc.so의 execve 함수

sysenter 후 int $0x80을 한다고? 이건 왜 이런지 모르겠다.

<< 커널 영역 주소 같아 보이지만, 유저 영역이다.

진짜는 여기있다. 이것이 바로 리눅스 커널의 vdso다.

인자를 넣고 execve를 호출하면, 그 내부에서 스택으로 넘어온 인자들을 레지스터에 각각 저장하고, vdso를 통해 __kernel_vsyscall을 호출해 최종적으로 시스템콜 인터럽트를 날리고 있다.

어셈블리로 재작성하기

우리는 여기서 필수적인 요소만 뽑아볼 수 있다.

인자 문자열
레지스터에 인자 문자열 주소 저장
시스템콜 인터럽트

위 요소들만 있으면 시스템콜을 호출해 실행중인 프로세스를 쉘로 바꿀 수 있다.

컴파일 결과

그래서 그 부분만 다시 적은 것이 위 어셈블리다. (읽기 편하라고 일부러 10진수로 쓴 것이 강의자료와 조금 다르다)

그리고 재미있게도 실행되지 않는다.

한 줄씩 실행하면서 원인을 알아보자.

여기서 바로 segmentation fault가 발생했다.

esi에 저장된 주소가 어느 영역인지를 고민해보면 쉽다. 바로 .rodata 영역이다.

.text인지 .rodata인지는 확실하지 않지만, 확실한건 쓰기 권한이 없다.

쓰기 권한이 없는 영역에 쓰기를 수행했기 때문에 segfault가 발생했다.

해당 영역(.text) 영역에 쓰기 권한을 주면 실행된다.

그러나 우리가 원하는 건 이 쉘코드를 다른 프로그램에 집어넣는것. 다른 프로그램들은 보통 code 영역에 쓰기 권한이 없다.

따라서, 이 쉘 코드를 잘 추출해서 쓰기 가능한 영역 (스택 영역)에 넣고, 실행해보도록 하자.

어셈을 보니 0x8049755 가 LC0인것 같다.

그러면, 0x8049755+0x7(/bin/sh) 이 바로 쉘코드의 끝부분이라고 할 수 있다.

따라서, 프로그램의 시작부터, 끝까지 덤프를 뜨도록 하자.

dump memory shell_dump 0x08049728 0x8049755+0x7

쉘 코드 덤프

xxd -p <덤프파일명> | tr -d '\n' | sed 's/../\\x&/g'

문자열로 추출

\xbe\x55\x97\x04\x08\xc6\x46\x07\x00\x89\x76\x08\xc6\x46\x0c\x00\xb8\x0b\x00\x00\x00\x89\xf3\x8d\x4e\x08\xba\x00\x00\x00\x00\xcd\x80\xb8\x01\x00\x00\x00\xbb\x00\x00\x00\x00\xcd\x80\x2f\x62\x69\x6e\x2f\x73\x68

결과

이걸 이제 C 프로그램에 넣고 실행한다.

는 segfault

아까와 터진 부분이 다르다. 이번엔 실행 권한이 없는 것이 문제다.

해당 코드를 스택에 집어넣고, 스택 자체에 실행 권한을 줘본다.

또 segfault

segfault 위치가 바뀌었다.

‣

0x8049755 위치는 .text영역이다.

익숙한 주소일텐데, 아까 쉘 코드의 LC0 영역에 대한 주소다.

이것이 하드코딩 되어 있기 때문에 segfault가 발생한 것이다.

아무리 쉘코드를 스택 영역으로 옮기고, 스택 영역 자체에 실행 권한을 주었더라도, .text 영역에 write를 하고 있으니 즉시 segfault가 발생할 수 밖에 없다.

하드코딩된 주소를 동적으로 얻어올 수는 없을까?

‣

Trampolining 기법

위 기법을 적용해 컴파일한 프로그램에서 쉘 코드를 뽑는다.

시작은 0x8049728, 끝은 (esi에 저장된 문자열의 주소 + 문자열 길이(7)) = 0x8049758+7 이다.

\xeb\x29\x5e\xc6\x46\x07\x00\x89\x76\x08\xc6\x46\x0c\x00\xb8\x0b\x00\x00\x00\x89\xf3\x8d\x4e\x08\xba\x00\x00\x00\x00\xcd\x80\xb8\x01\x00\x00\x00\xbb\x00\x00\x00\x00\xcd\x80\xe8\xd2\xff\xff\xff\x2f\x62\x69\x6e\x2f\x73\x68

이제 이걸 아까 shelltest.c 에 넣고 실행해보자. 구분을 위해 shelltest2.c로 복사해서 수행하겠다.