1

Android逆向工程 初篇

本篇文章建立于有开发环境(jdk,android sdk)基础之上,没有环境的朋友自己去配。

什么是APK? </p>
什么是Dalvik?</p>
什么是Smali?</p>

什么是APK

APK的本质是一个zip的压缩包,用压缩软件打开后就可以看到里面的文件以及结构。


assets/res:都是资源目录,但是二者有区别。

1: Assets

不会再R.java文件里面生成相应的引索,Assets文件夹可以自己随意创建文件夹,用AssetsManager类访问,存放再此目录下的文件都会被打包到Apk里面。

2: lib

so库存放位置,一般由NDK编译得到.

META-INF

存放工程的一下属性文件,例如Manifest.MFMETA-INF

3: res

会在R.java文件生成相应的引索,软件里面使用到的资源文件会在这里生成相对应的引索。res/raw和assets文件夹存不需要编译的二进制文件,比如字体,声音.在res文件夹里面可以定义一下目录:

res/anim:存放动画资源.
res/xml :存放xml文件,利用getResource().getXML()得到资源.

res/raw :该目录下的文件可以直接复制到设备上,不能有子文件夹,编译软件时,这里的数据不需要编译,直接加入到程序安装包中,使用方法是getResource().OpenRawResources(ID),其中参数ID的形式是R.raw.XXX.

4: AndroidManifest.xml

Android工程的基础配置属性文件.

5: Classes.dex

Java代码编译得到的Dalvik VM能执行的文件

6: resources.arsc

里面就是一些资源文件的引索


什么是Dalvik(逆向的基础)

Dalvik是Google专门为Android操作系统设计的一个虚拟机,经过深度优化. Dalvik有专属的文件执行格式dex,而Jvm则执行的是Java字节码. DalvikVM比JVM速度更快,占用控件少.通过Dalvik的字节码我们不能直接看到原来的逻辑代码,这时需要借助ApkTool或者dex2jar jd-gui工具来看java代码.由于Apk在打包之前都会有混淆,所以,基本上很难看出来逻辑处理,除非很简单的逻辑.

什么是Smali(主角,一般人是很难看懂它的语法的,很少人能坚持研究.

先给大家露给脸



上面是一个监听点击事件,点击后关闭窗口并且调用一些方法做某些事情.

从上面可以看到函数声明使用.method开始 .end method结束,
方法定义:

Func-Name(Para-TypePara-Type2Para-Type3...)return-Type<br>
例子:<br>
public final onClick(DialogInterface, I)V 对应 public final void onClick(DialogInterface,int);<br>
hello()V 对应 void hello();<br>
hello(III)Z 对应 boolean hello(int,int,int);<br>
hello(Z[I[ILjava/lan/String;J)Ljava/String; 对应 hello(boolean,int[],int[],String,long)
<br>

是不是很简单???

Smali语法

.method                      方法<br>
.parameter                  方法参数<br>
.prologue                  方法开始<br>
.line 12                  此方法位于第12行<br>
invoke-super              调用父函数<br>
const/high16  v0, 0x7fo3  把0x7fo3赋值给v0<br>
invoke-direct              调用函数<br>
return-void                  函数返回void<br>
.end method                  函数结束<br>
new-instance              创建实例<br>
iput-object                  对象赋值<br>
iget-object                  调用对象<br>
invoke-static              调用静态函数<br>

if-eq vA, vB, :cond_**    如果vA等于vB则跳转到:cond_**<br>
if-ne vA, vB, :cond_**      如果vA不等于vB则跳转到:cond_**<br>
if-lt vA, vB, :cond_**    如果vA小于vB则跳转到:cond_**<br>
if-ge vA, vB, :cond_**      如果vA大于等于vB则跳转到:cond_**<br>
if-gt vA, vB, :cond_**      如果vA大于vB则跳转到:cond_**<br>
if-le vA, vB, :cond_**    如果vA小于等于vB则跳转到:cond_**<br>
if-eqz vA, :cond_**          如果vA等于0则跳转到:cond_**<br>
if-nez vA, :cond_**          如果vA不等于0则跳转到:cond_**<br>
if-ltz vA, :cond_**       如果vA小于0则跳转到:cond_**<br>
if-gez vA, :cond_**          如果vA大于等于0则跳转到:cond_**<br>
if-gtz vA, :cond_**          如果vA大于0则跳转到:cond_**<br>
if-lez vA, :cond_**        如果vA小于等于0则跳转到:cond_**<br>
继续来点理论,后面会有实例

数据操作指令 [->寄存器赋值]

数据操作指令为move, move指令的原先为"move destination source",move指令更具字节码大小与类型不同,后面会跟上不同的后缀.

1: "move vA,vB" vB->vA,源寄存器与目的寄存器都是4位.<br>
2: "move/from16 vAA,vBBBB" vBBBB->vAA,源寄存器16位,目的寄存器8位.<br>
3: "move/16 vAAAA,vBBBB" vBBBB->vAAAA,源寄存器和目的寄存器都是16位.<br>
4: "move-wide vA,vB" 为4位的寄存器对赋值.源寄存器与目的寄存器都为4位.<br>
5: "move-wide/from16 vAA,vBBBB" 等于 "move-wide/16vAAAA,vBBBB" 实现与move-wide相同.<br>
6: "move-object vA,vB" 为对象赋值.源寄存器和目标寄存器都为4为.<br>
7: "move-object/from16 vAA,vBBBB" 为对象赋值,源寄存器16位,目标寄存器8位.<br>
8: "move-result vAA" 将上一个invoke类型指令操作的单字非对象结果赋值给vAA寄存器.<br>
9: "move-result-wide vAA" 将上一个invoke类型指令操作的双字非对象结果赋值给vAA寄存器.<br>
10: "move-result-object vAA" 将上一个invoke类型指令操作的对象结果赋值给vAA寄存器.<br>
11: "move-exception vAA" 保存一个运行时发生异常到vAA寄存器,这条指令必须是异常发生时的异常处理器的一条指令,否则指令无效.<br>

返回指令

返回指令指的是函数结尾时运行的最后一条指令。它的基础字节码为teturn,共有以下四条返回指令:

"return-void":表示函数从一个void方法返回。<br>
“return vAA”:表示函数返回一个32位非对象类型的值,返回值寄存器为8位的寄存器vAA。<br>
“return-wide vAA”:表示函数返回一个64位非对象类型的值,返回值为8位的寄存器对vAA。<br>
“return-object vAA”:表示函数返回一个对象类型的值。返回值为8位的寄存器vAA。<br>
.field private isFlag:z  定义变量

普通字段操作指令有:iget,iget-wide,iget-object,iget-boolean,iget-byte,iget-char,iget-short,iput,iput-wide,iput-object,iput-boolean,iput-byte,iput-char,iput-short。

静态字段操作指令有:sget,sget-wide,sget-object,sget-boolean,sget-byte,sget-char,sget-short,sput,sput-wide,sput-object,sput-boolean,sput-byte,sput-char,sput-short。

实例

Demo

用的软件是JEB2

博客地址:http://blog.csdn.net/QQ541159...


oujie
8 声望4 粉丝