以太坊的ABI编码

  • A+
所属分类:区块链

ABI全称Application Binary Interface, 是调用智能合约函数以及合约之间函数调用的消息编码格式定义,也可以理解为智能合约函数调用的接口说明. 类似Webservice里的SOAP协议一样;也就是定义操作函数签名,参数编码,返回结果编码等。

使用ABI协议时必须要求在编译时知道类型,即强类型相关.

智能合约的ABI接口定义

当一个智能合约编译出来后, 他的abi接口定义就确定了. 比如下面的智能合约:

contract myContract {
 event Log_lotus(bytes32 _id, bytes32[] users);
 uint k=0;
 function lotus(uint a, bytes32 b, bytes32[] c) public {
 k=a;
 Log_lotus(b,c);
 }}

生成的字节码:

606060405260008055341561001357600080fd5b610176806100226000396000f300606060405260043610610041576000357c0100000000000000000000000000000000000000000000000000000000900463ffffffff168063e17b829214610046575b600080fd5b341561005157600080fd5b6100b4600480803590602001909190803560001916906020019091908035906020019082018035906020019080806020026020016040519081016040528093929190818152602001838360200280828437820191505050505050919050506100b6565b005b826000819055507fa756dbb78a87f957869324b276aea920464fad0955c2e8dc59f80bef9ceb8343828260405180836000191660001916815260200180602001828103825283818151815260200191508051906020019060200280838360005b83811015610131578082015181840152602081019050610116565b50505050905001935050505060405180910390a15050505600a165627a7a723058202b9bfbc1e3fc4afd0d10fce971ba4109707f356f5c5c3f8ac7601f76b819b7330029

生成的abi定义:

[
    {
        "constant": false, //方法修饰符,false表示函数内可以修改状态变量
        "inputs": [ //方法参数,它是一个对应数组,数组里的每个对象都是一个参数说明
            {
                "name": "a", //第一个参数的名字
                "type": "uint256" //第一个参数的类型
            },
            {
                "name": "b", //第二个参数的名字
                "type": "bytes32" //第二个参数的类型
            },
            {
                "name": "c", //第三个参数的名字
                "type": "bytes32[]" ////第三个参数的类型
            }
        ],
        "name": "lotus", //方法名
        "outputs": [], //方法返回值,格式和inputs类型相同
        "payable": false,
        "stateMutability": "nonpayable",
        "type": "function" //方法类型,function, constructor, fallback,event
    },
    {
        "anonymous": false,
        "inputs": [
            {
                "indexed": false,
                "name": "_id",
                "type": "bytes32"
            },
            {
                "indexed": false,
                "name": "users",
                "type": "bytes32[]"
            }
        ],
        "name": "Log_lotus",
        "type": "event" 
    }]

可以看出, 生成abi包含了2个定义: 函数 lotus , 事件 Log_lotus , 各个字段含义见上. 根据该abi定义,就可以生成调用该智能合约函数的abi格式的数据了.

格式简单的可以表示为: 函数选择器+参数编码

函数选择器

一个函数调用的前四个字节数据指定了要调用的函数签名。计算方式是使用函数签名的 keccak256 的哈希,取4个字节。

bytes4(keccak256("foo(uint32,bool)"))

函数名如果有多个参数使用,隔开,要去掉表达式中的所有空格。在geth客户端,通过命令可以得到hash:

web3.sha3("foo(uint32,bool)")"0xcc822237a37f9290b70dab4d640156d816bf8abdb959b5971d803a639dadef98" //截取前4个字节 即0xcc822237

参数编码

由于前面的函数签名使用了四个字节,参数的数据将从第五个字节开始。

根据参数类型,编码规则有所区别:

  • uint<M>:M为integer类型代表M bits,0 < M <= 256 , M % 8 == 0,如uint32,uint8,uint256。

  • int<M>:同上。同为从8到256位的无符号整数。

  • uint和int:整型,分别是uint256和int256的别名。注意: 函数参数类型是uint,转sha3码时要变成uint256。

  • address:地址,20个字节,160bits。

  • bool:布尔类型,1个字节,true:1,false:0。

  • bytes<M>:固定大小的字节数组,0<M<=32,byte都是bytes1的别名。

  • bytes:动态分配大小字节数组。不是一个值类型!

  • string:动态大小UTF8编码的字符串,不是一个值类型!

除了bytes,和string, 其他类型的数据不足32字节长度的需要加0补足32字节. 动态长度的编码在例子中介绍.

举例

函数: function baz(uint32 x, bool y) :

调用: baz(69, true)

生成的数据如下:

  • 0xcdcd77c0: 使用函数选择器确定的函数ID。通过 bytes4(keccak256("baz(uint32,bool)")) 生成。

  • 0x0000000000000000000000000000000000000000000000000000000000000045。第一个参数,uint32位的值 69 ,并补位到32字节。

  • 0x0000000000000000000000000000000000000000000000000000000000000001。第二值 boolean 类型值 true 。补位到32字节。

返回结果是一个bool值,在这里,返回的是false:

  • 0x0000000000000000000000000000000000000000000000000000000000000000

函数: f(uint,uint32[],bytes10,bytes)

调用: (0x123, [0x456, 0x789], "1234567890", "Hello, world!")

函数选择器: bytes4(sha3("f(uint256,uint32[],bytes10,bytes)"))

对于 固定大小的类型 值 uint256 和 bytes10 ,直接编码值。

对于 动态内容类型 值 uint32[] 和 bytes ,我们先 编码偏移值 ,偏移值是整个值编码的开始到真正存这个数据的偏移值(这里不计算头四个用于表示函数签名的字节)。

所以参数编码数据依次为:

  • 0x0000000000000000000000000000000000000000000000000000000000000123,32字节的 0x123 。

  • 0x0000000000000000000000000000000000000000000000000000000000000080 (第二个参数的由于是动态内容类型,所以这里存储偏移值,4*32 字节,刚好是头部部分的大小)

  • 0x3132333435363738393000000000000000000000000000000000000000000000 (“1234567890” 在右侧补0到32字节大小)

  • 0x00000000000000000000000000000000000000000000000000000000000000e0 (第四个参数的偏移 = 第一个动态参数的偏移值 + 第一个动态参数的大小 = ** ** 4* 32 + 3* 32 ** ** 动态长度的计算见后)

尾部部分的第一个动态参数, [0x456, 0x789] 编码拆解如下:

  • 0x0000000000000000000000000000000000000000000000000000000000000002 (整个数组的长度,2)。

  • 0x0000000000000000000000000000000000000000000000000000000000000456 (第一个元素)

  • 0x0000000000000000000000000000000000000000000000000000000000000789(第二个元素)

最后我们来看看第二个动态参数的的编码, Hello, world! 。

  • 0x000000000000000000000000000000000000000000000000000000000000000d (元素的字节长度,13)

  • 0x48656c6c6f2c20776f726c642100000000000000000000000000000000000000 (“Hello, world!” 补位到32字节,里面是按ascii编码的,可以查查对应的编码。)

所以最终结果是:

0x8be65246
0000000000000000000000000000000000000000000000000000000000000123
0000000000000000000000000000000000000000000000000000000000000080
3132333435363738393000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000000000000000e0
0000000000000000000000000000000000000000000000000000000000000002
0000000000000000000000000000000000000000000000000000000000000456
0000000000000000000000000000000000000000000000000000000000000789
000000000000000000000000000000000000000000000000000000000000000d
48656c6c6f2c20776f726c642100000000000000000000000000000000000000

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: