一个语言的诞生(Act III)

第三幕 垃圾回收

看过微软 .net coreclr 的源代码后,觉得 Lua、PHP 和 Python 的垃圾回收代码与之相比简直就是个玩具。而 Hotspot JVM 的垃圾回收算法更加复杂。

常见的垃圾回收技术能大致分成:引用计数、标记清理、标记缩并和节点复制几种。高级的技术有垃圾分代收集、渐进及并发收集、分布式垃圾收集。复杂的垃圾回收算法会根据对象的性质和内存的使用情况来选择不同的垃圾回收算法。

……

一个语言的诞生(Act II)

第二幕 对象内存布局

那些不怎么“动态”的语言,比如C#和JAVA,一般都会把数据类型分成“值”和“引用”,值类型是分配在栈上的,引用类型是分配在堆上。而“动态”的语言,比如“PHP”和“Python”所有的数据都是动态分配在堆上的。这么做的缺点一是浪费内存,二是访问慢。浪费内存是因为PHP和Python的对象都经过重度的封装,一个简单的整型经过封装后的大小是原来的4、5倍。访问慢的原因是每次创建一个对象都要申请一次内存,而且访问对象必须通过指针,这样一搞CPU的1、2级缓存根本就没有用了嘛。

……

一个语言的诞生(Act I)

第一幕 哈希表

哈希表是动态脚本语言的基石。动态语言中,全局变量表、全局字符串表、对象虚函数表、元数据表皆为哈希表。欲实现语言,则必先实现哈希表。

哈希表原理很简单,不再赘述。不同语言实现的哈希表主要区别在于处理碰撞的机制不同。一种叫“Separate chaining”,PHP的哈希表使用了这种方式;另一种叫“Open addressing”,Lua的哈希表使用的是这种。前者发生碰撞会创建一个新的bucket,然后用链表将所有碰撞的bucket链接起来;而后者在现有的buckets中找到一个空的bucket来存放发生碰撞的key-value pair。我选择的是后一种方式,一方面是节约内存,另一方面还能节省GC开销。

……

一个语言的诞生(Prologue)

一直琢磨着自己实现一个脚本语言。因为懒,直到最近才动手。

构想中的语言语法类似ActionScript,支持GC、闭包、Lambda表达式、协程、尾递归优化、迭代器/生成器、允许(编译期)强类型绑定的可嵌入式动态脚本语言。基础类型支持NULL、布尔型、32位整型、64位长整型、双精度浮点数、元组、列表、字典、闭包、协程、对象、用户数据等。

……

跨平台 C 语言开发
  1. 通过 WIN32 宏来判断是否为 Windows 平台。64位 Windows 也会定义 WIN32 宏,此外还定义 WIN64 宏,有些编译器可能是 Windows__WIN32__WIN32_WIN64
  2. 通过 _MSC_VER 宏判断是否是VC编译器
  3. 通过 __GNUC__ 宏来判断是否为 gcc 编译器
  4. Windows 平台上的 gcc 编译器支持__declspec(dllimport)__declspec(dllexport)
  5. Linux 平台上 gcc 通过 __attribute__ ((visibility("default"))) 来导出函数
  6. VC不支持 inline 关键字,要用 __inline。可以用如下代码定义:
    C#if defined(_MSC_VER) && !defined(__cplusplus) && !defined(inline)
        #define inline __inline
    #endif
  7. 数组索引用 size_t 类型、指针运算用 uintptr_t, intptr_t, ptrdiff_t、平台无关整型用 int32_t, int64_t
  8. 64位平台上的 sizeof(long double) 是16字节(VC不支持),但是实际使用长度是12字节,4字节填充的是随机数据(绝对大坑)
  9. 如果 C 代码可能被 C++ 项目使用,最好根据 __cplusplus 宏做下判断
  10. MacOSX的平台宏是 __APPLE____MACH__(这个没确认)
  11. 补充几个编译器识别的宏:__BORLANDC____llvm____clang____WATCOMC__

……

Lua 源代码中的字节对齐

Lua 源码中定义了一个叫 L_Umaxalign 的数据类型:

ctypedef union { 
  double u; 
  void *s; 
  lua_Integer i; 
  long l; 
} L_Umaxalign;

这个结构其实是该平台上最长的数据类型。

……

葱油饼

制作了三次葱油饼,累积了一些心得体会,特此记录。

……

    音乐剧《罗密欧与朱丽叶》中文歌词

    第一幕

    02.维罗纳

    王子:
    你们认为自己什么都见过
    你们游历天下,包揽群书
    没有什么能让你们吃惊
    欢迎来到维罗纳

    你们认为人是善良的
    因为他能写出美妙的歌
    如果你觉得这一首歌很优美
    欢迎来到维罗纳

    当然,这里同别处一样
    人们并不更坏,也并不更好
    嗨!你们今夜来到我们这里
    要么是个错误,要么纯属偶然

    (副歌:)
    你们来到了维罗纳,美丽的维罗纳
    这座城市的居民相互厌恶
    人们想离开,却留了下来
    这里不是国王钟爱的地方
    这里有两个家族称王称霸
    你不需要选择自己的立场
    人们早就替你作出了选择
    你们来到了维罗纳,我们谈论的是维罗纳
    仇恨象毒液在我们的生命中流淌
    就象我们的血液一样
    我们的花园同样四季芬芳
    我们的女子同样美丽大方
    这里的景色象人间天堂
    但我们灵魂却在地狱里徜徉
    你们来到了维罗纳

    ……

    PHP 中的服务定位和依赖注入

    尝试了很多PHP框架,有轻量级的,也有企业级的,发现解耦都做得很不好,自由度都很差。Zend framework2.0 做得还不错,就是封装太多,不够轻量。

    一、创建对象

    从最原始的new操作符,到abstract factory或builder等经典创建模式,都不能满足人民群众日益高涨的解耦需求。后来,MF创造了控制反转(IoC)/依赖注入(DI)理论,提供了一个完美的解耦方案。听说一个叫"春"的JAVA框架实现了完美的IoC容器,不过我也没接触过,不太了解。

    ……

    赐予的瘟疫

    David Brin 创作的科幻小说。

    ……