This article will be also translated to English later.
《云图》中的水手自述”所见甚广,难以为奴(Seen too much of the world, I no good slaves)“,曾经航行的距离变为了反抗的勇气;常用语”异地恋“和其别称”远距离恋爱“区别在于,前者听起来像是两个孤立的点、后者像一条跨越山海的线段;顾城的《远和近》对比深不可测的心理距离和遥不可及的自然距离:
你看我时很远,
你看云时很近。
在下文中,我将介绍自己在计算语言学和建筑的空间句法学习中遇到的“距离”,以及个人的胡乱思考。注意这并不是一篇科普文章,我不喜欢大段转述或翻译既往研究,本文可以被认为是”我最近在忙啥“的展示,我会附上参考资料和学习资源的链接。
在学习fuzzywuzzy时,我接触到了模糊匹配算法,其中提到了编辑距离,即“字符串A变成字符串B所需要的最少变化(插入,删除,替换)次数”编辑距离越小,两个字符串越相似。
编辑1 kitten → sitten 把k变成s
编辑2 sitten → sittin 把e变成i
编辑3 sittin → sitting 末尾加上g
如果想提升自主阅读能力,不妨算一下“黑魔法火龙果”和“黑火龙魔法果”的编辑距离!
有别于自然语言和数学语言,空间句法模型试图以形式语言描述建筑和城市形态,因此空间句法除了研究“欧几里得距离(Euclidean distance)”,也关注“拓扑距离(Topological distance)”和“转角距离(Angular distance)”。
鉴于这不是一篇的科普文,我再举个极其不严谨的例子:
为了学习时不吃东西,我把一个火龙果放在了电脑后面,这时我和火龙果的欧几里得距离/米制距离是50厘米;拓扑距离/深度是2,因为拓扑关系是“我-电脑-火龙果”,转角距离是180度左右。
这三个变量巧妙而全面地描述了我和火龙果的关系。试想,如果没有拓扑距离,通过欧几里得距离和转角距离的描述,火龙果似乎触手可及,但是我学习时并不能直接够到火龙果!
可见,空间句法中的距离不仅用于定位,更重要的是与个人体验相关。
不难发现,距离即是被数据表征的标量,也被建构(construct),具有社会文化意义,两者微妙的关系始终让我心旌摇荡,我认为它具有无可比拟的魅力,也因此坚定地向往”人文社科中的量化研究“的道路。
最近在看《史前星球》(Prehistoric Planet),在观察动物为生存的奔波和自然残酷的法则之外,我想没有厚重铠甲或尖锐牙齿的人类比起恐龙唯一的优势是脑子更好使,引用安兰德的话就是”猫猫猎食,人类学习和创造(The purpose of birds is to fly, the purpose of cats is to hunt, the purpose of man is to learn and create)“。食肉牛龙(Carnotaurus)为了使密林中距离更远的同伴听见自己,进化出低频的叫声;脑子好使的人类可以在扩充“距离”的含义、分类、算法,我在学习和思考中获得了“欣于所遇,暂得于己”的快乐。
我记得十年前互联网上流行过“汉字的顺序不影响阅读”的实验,比如即使把刚才这行字变成“字汉的序顺影响不阅读”,你大概率能猜到原本的意思,两者编辑距离很大,有人认为起作用的是认知心理学中的自上而下加工(Top-down Processing)机制,指知觉者的习得的经验、期望、动机,引导着知觉者在知觉过程中的信息选择、整合、和表征的建构,也称为建构知觉理论。人类不光可以建构距离,还可以建构承载距离的信息,脑子是个好东西!
最近还喜欢去健身房进行力量训练,我开始思考为什么我讨厌有氧运动,一个原因是它过于强调“距离”数据本身,“跑了20公里/跳了1小时健身操”,对肌肉的尺寸和能力较难产生肉眼可见的改观,我功利心极重,想看到和展示“距离”的结果。
另一方面,我们需要亲身去体验距离,类似于现象学说的“具身性(embodiment)”:
京津城际铁路长120公里,但每次在高铁上充满期待、计划活动的半小时,不能用距离概括。
于是我想总结,“航行的距离成为反抗的勇气”的充要条件是确实享受航行的过程,我们使用各类距离、试图更为精准地解释世界、回答“为什么”之前,需要先尽情体验走过距离的旅程,回答“如何”。