Android逆向工程 初篇

Android逆向工程初篇

本篇文章建立于有开发环境（jdk，android sdk）基础之上，没有环境的朋友自己去配。

什么是APK？ </p>
什么是Dalvik？</p>
什么是Smali？</p>

什么是APK

APK的本质是一个zip的压缩包，用压缩软件打开后就可以看到里面的文件以及结构。

assets/res：都是资源目录，但是二者有区别。

1: Assets

不会再R.java文件里面生成相应的引索，Assets文件夹可以自己随意创建文件夹，用AssetsManager类访问，存放再此目录下的文件都会被打包到Apk里面。

2: lib

so库存放位置,一般由NDK编译得到.

META-INF

存放工程的一下属性文件,例如Manifest.MFMETA-INF

3: res

会在R.java文件生成相应的引索，软件里面使用到的资源文件会在这里生成相对应的引索。res/raw和assets文件夹存不需要编译的二进制文件,比如字体,声音.在res文件夹里面可以定义一下目录:

res/anim:存放动画资源.
res/xml :存放xml文件,利用getResource().getXML()得到资源.

res/raw :该目录下的文件可以直接复制到设备上，不能有子文件夹，编译软件时，这里的数据不需要编译，直接加入到程序安装包中，使用方法是getResource().OpenRawResources(ID),其中参数ID的形式是R.raw.XXX.

4: AndroidManifest.xml

Android工程的基础配置属性文件.

5: Classes.dex

Java代码编译得到的Dalvik VM能执行的文件

6: resources.arsc

里面就是一些资源文件的引索

什么是Dalvik(逆向的基础)

Dalvik是Google专门为Android操作系统设计的一个虚拟机,经过深度优化. Dalvik有专属的文件执行格式dex,而Jvm则执行的是Java字节码. DalvikVM比JVM速度更快,占用控件少.通过Dalvik的字节码我们不能直接看到原来的逻辑代码,这时需要借助ApkTool或者dex2jar jd-gui工具来看java代码.由于Apk在打包之前都会有混淆,所以,基本上很难看出来逻辑处理,除非很简单的逻辑.

什么是Smali(主角,一般人是很难看懂它的语法的,很少人能坚持研究.

先给大家露给脸

上面是一个监听点击事件,点击后关闭窗口并且调用一些方法做某些事情.

从上面可以看到函数声明使用.method开始 .end method结束，
方法定义:

Func-Name(Para-TypePara-Type2Para-Type3...)return-Type<br>
例子:<br>
public final onClick(DialogInterface, I)V 对应 public final void onClick(DialogInterface,int);<br>
hello()V 对应 void hello();<br>
hello(III)Z 对应 boolean hello(int,int,int);<br>
hello(Z[I[ILjava/lan/String;J)Ljava/String; 对应 hello(boolean,int[],int[],String,long)
<br>

是不是很简单???

Smali语法

.method　　                    方法<br>
.parameter　　                方法参数<br>
.prologue　　                方法开始<br>
.line 12　　                此方法位于第12行<br>
invoke-super　　            调用父函数<br>
const/high16  v0, 0x7fo3　　把0x7fo3赋值给v0<br>
invoke-direct　　            调用函数<br>
return-void　　                函数返回void<br>
.end method　　                函数结束<br>
new-instance　　            创建实例<br>
iput-object　　                对象赋值<br>
iget-object　　                调用对象<br>
invoke-static　　            调用静态函数<br>

if-eq vA, vB, :cond_**    如果vA等于vB则跳转到:cond_**<br>
if-ne vA, vB, :cond_**      如果vA不等于vB则跳转到:cond_**<br>
if-lt vA, vB, :cond_**    如果vA小于vB则跳转到:cond_**<br>
if-ge vA, vB, :cond_**      如果vA大于等于vB则跳转到:cond_**<br>
if-gt vA, vB, :cond_**      如果vA大于vB则跳转到:cond_**<br>
if-le vA, vB, :cond_**    如果vA小于等于vB则跳转到:cond_**<br>
if-eqz vA, :cond_**          如果vA等于0则跳转到:cond_**<br>
if-nez vA, :cond_**          如果vA不等于0则跳转到:cond_**<br>
if-ltz vA, :cond_**       如果vA小于0则跳转到:cond_**<br>
if-gez vA, :cond_**          如果vA大于等于0则跳转到:cond_**<br>
if-gtz vA, :cond_**          如果vA大于0则跳转到:cond_**<br>
if-lez vA, :cond_**        如果vA小于等于0则跳转到:cond_**<br>

继续来点理论,后面会有实例

数据操作指令 [->寄存器赋值]

数据操作指令为move, move指令的原先为"move destination source",move指令更具字节码大小与类型不同,后面会跟上不同的后缀.

1: "move vA,vB" vB->vA,源寄存器与目的寄存器都是4位.<br>
2: "move/from16 vAA,vBBBB" vBBBB->vAA,源寄存器16位,目的寄存器8位.<br>
3: "move/16 vAAAA,vBBBB" vBBBB->vAAAA,源寄存器和目的寄存器都是16位.<br>
4: "move-wide vA,vB" 为4位的寄存器对赋值.源寄存器与目的寄存器都为4位.<br>
5: "move-wide/from16 vAA,vBBBB" 等于 "move-wide/16vAAAA,vBBBB" 实现与move-wide相同.<br>
6: "move-object vA,vB" 为对象赋值.源寄存器和目标寄存器都为4为.<br>
7: "move-object/from16 vAA,vBBBB" 为对象赋值,源寄存器16位,目标寄存器8位.<br>
8: "move-result vAA" 将上一个invoke类型指令操作的单字非对象结果赋值给vAA寄存器.<br>
9: "move-result-wide vAA" 将上一个invoke类型指令操作的双字非对象结果赋值给vAA寄存器.<br>
10: "move-result-object vAA" 将上一个invoke类型指令操作的对象结果赋值给vAA寄存器.<br>
11: "move-exception vAA" 保存一个运行时发生异常到vAA寄存器,这条指令必须是异常发生时的异常处理器的一条指令,否则指令无效.<br>

返回指令

返回指令指的是函数结尾时运行的最后一条指令。它的基础字节码为teturn，共有以下四条返回指令：

"return-void"：表示函数从一个void方法返回。<br>
“return vAA”：表示函数返回一个32位非对象类型的值，返回值寄存器为8位的寄存器vAA。<br>
“return-wide vAA”：表示函数返回一个64位非对象类型的值，返回值为8位的寄存器对vAA。<br>
“return-object vAA”：表示函数返回一个对象类型的值。返回值为8位的寄存器vAA。<br>
.field private isFlag:z　　定义变量

普通字段操作指令有：iget，iget-wide，iget-object，iget-boolean，iget-byte，iget-char，iget-short，iput，iput-wide，iput-object，iput-boolean，iput-byte，iput-char，iput-short。

静态字段操作指令有：sget，sget-wide，sget-object，sget-boolean，sget-byte，sget-char，sget-short，sput，sput-wide，sput-object，sput-boolean，sput-byte，sput-char，sput-short。

实例

Demo

用的软件是JEB2

博客地址:http://blog.csdn.net/QQ541159...

Android逆向工程初篇