Dahua's profile笑对人生,傲立寰宇PhotosBlogLists Tools Help
    November 28

    京华烟云随想

    列车在驶向香港的路上,轻音乐在耳畔回响,可是思绪仍旧停留在昨晚深夜才匆匆看完的电视剧《京华烟云》上面。和以往的旅程一样,火车上确实是胡思乱想的地方。对于忙于学业的我,也许,在独处的时候放飞自己的思想就是最好的休息了。
     
    从艺术角度说,这部电视剧还算中规中矩,没有太多让我惊喜的地方。可是电视剧中所叙述的故事却让我深思。这部作品塑造了一个非常完美的女性的形象——姚木兰,她的才华,善良,大度无论在当时还是在现在都堪称楷模了,正如戏中所说完美的几乎没有缺点。可是,她完美的人格,换来的却是一段无奈而痛苦的婚姻生活,一个有缺憾的人生。而在面对后来的“第三者”曹丽华的时候,她的那种令人敬佩的大度,给她带来的却是无尽的伤心。虽然,她的苦心最后改变了她的丈夫,让挣扎在漩涡中的婚姻生活逐渐回到了正轨。可是,这已经不能称为美满了,因为这五年的创伤也许将留下终生的疤痕,而她最终也没有和自己真正爱慕的人走在一起。

    故事中的其他人物,都在用自己不同的方式追求着自己的幸福:姚莫愁的叛逆,牛怀玉的执著,孔立夫的真诚,姚迪非的爽朗和红玉的娇弱,交织在一起,凝成了一段色彩斑斓的画卷。可是,什么才是追求自己幸福的正确道路呢?林语堂先生没有告诉我们答案。不过故事让我们认识到,无论是幸福还是痛苦,只有每个人在实际的追索的道路上才能尝到的。任何预先的一厢情愿的想象,最后往往是事与愿违的。自己的幸福,是在自己在追求的道路上不断跌倒,又不断勇敢地爬起来面对才能最终得到的。这一路上,也许是辛劳的汗水,也许是辛酸的血泪,也许是旖旎的风光,但是都是一种人生的体验——这是生活留给我们最宝贵的财富。

    故事中的曹丽华——木兰的丈夫曾孙亚婚后几年内的情人,也许她所做的在传统的道德看来,是值得谴责的。可是,她和孙亚确实深深相爱着,他们在最艰难的处境下,为了追求自己自由的幸福,对家庭和世俗压力进行了勇敢的反抗。曹丽华为此献出了自己年轻的生命。在这个故事里,无论是孙亚,丽华,木兰还是孙亚的那位威严的母亲,其实都是善良的人,可是在传统道德和自由爱情的激烈冲突中被撕裂成水火不容的两方,木兰为挽救局面所做的种种努力,随着孙亚和丽华在外生下孩子,丽华在曾家门前自杀而死,而最终彻底失败了。木兰和立夫为了坚守自己的道德,有情人不能终成眷属,铸成了他们完美人格下的缺憾人生;曹丽华,莫愁在追求自由爱情的过程中遭受了灾难性的伤害。这种道德和情感的斗争,理想和现实的冲突,到了几十年后的今天仍旧没有解决。不过,前人的血迹也许能在我们追求幸福的过程中给我们带来一点思考。

    在故事的最后,日本人的到来破坏了一家人的宁静生活。姚思安在敌人的枪口下,点燃了整个王府的熊熊大火,和来抢夺甲骨的汉奸与敌人同归于尽。他临死前呼叫:“甲骨即使烧成灰烬,也要留在华夏大地上!”铮铮铁骨,可敬可佩。

    本来是为了娱乐和休息才看这部剧的,可是却很沉重。不过,仍旧感谢它给我带来的思索和感动。
    November 18

    Future directions of dimension reduction

    It is since a long time dimension reduction has been a core topic in statistical learning and related domains. Every year, a vast number of works devoted to this topic have been published. Despite its great advancement in the past decades, we rarely see a deep thinking in the fundamental question that where the dimension reduction methodologies originate from? This field has arrived at a critical place that significant breakthrough is difficult to achieve. Some researchers have advocated a pessimistic view that it is a sunset domain. However, from my point, it is still in a rudimentary state, a long way remains towards its true maturity. I believe that it is merely the sunset of current approach, but not the field of dimension reduction itself. Revitalization of the field relies on a novel and penetrating insight into the foundation on which the field is built up.
     
    We know dimension reduction is to address the redundancies embedded in representations. In my view, the redundancies stem from two types of commonalities: those across different entities, and those within an entity. The former is mainly utilized in machine learning; while the latter is exploited in compression (such as the zip tools you use everyday). Actually these two types of commonalities are closely connected as discussed below. If we consider each entity being a sample in a space, then the sample-space-structure, that is the structure of the distribution of these samples, embodies the inter-entity commonality. In another perspective, we can see each entity as an architecture consisting of multiple components, which are arranged in some order to form a reasonable entity. The sample-space-structure and the within-entity-structure are mutually coupled. Take the vector space for example, if the correlation between the components are linear, then all the vectors constitute a plain subspace of the sample space; otherwise, if it is nonlinear, their distribution spans a manifold. However, it is pity that most of current research only study either the sample-space-structure or inter-component-relation, the mechanism of how these two types of structures interact with each other is yet unclear. It is my belief that the investigation into this question would open up an unexplored realm, and lead to some ground-breaking works.
     
    Another issue yet to be solved is the generalization of the dimension reduction model. Most of current approaches accomplish dimension reduction by learning a model from so-called “training set” to capture the domain-specific prior, then for each new entity, only its individuality need to be encoded, thus a compact representation can be acquired. However, due to statistical fluctuation, limitation of data acquisition, the learned models often tend to biased. This phenomena is called “over-fitting” in learning literatures. Though it has been notices for many years, it is still regarded as among the most difficult problem in statistical learning. The well known mathematician V.N. Vapnik develop the VC-dimension theory to give a bound on generalization risk, however, the direct application of such a theory is difficult and infeasible. In practice, heuristic formulations based on margin, smoothness, entropy or Komogorov complexity are used. Up till now, in theory, the connection between generalization risk and complexity measurement is still an open issue; in practice, a general methodology for controlling model complexity is still unavailable.
     
    Furthermore, the diversity of our world determines that not all things can be encoded in a fixed-dimensional vector. Other representation forms such as variable-size set, unordered set, graph, group have their features, which make them specially suitable for expressing some entities. As vectors, these representations also have the problem of redundancies, thus dimension reduction should also be applied to them. A question arises that how to reduce redundancy for these representations? Are there any unified formulations for the dimension reduction methods in all these representations? It is an interesting direction to generalize the dimension reduction methods from Hilbert spaces to Banach spaces, metric spaces or even more general algebraic structures.
    November 16

    从CVPR谈积累

    CVPR的战斗终于结束了,这是一次让人难以忘怀的经历。

    虽然动笔写paper是一个多月前才开始的,但是这场战斗其实在8个月以前,也就是ICCV结束之后已经拉开帷幕了。从那个时候开始,我就开始有计划地为这次战斗进行全面的准备:补充数学基础,大量阅读论文,酝酿新的思路,以及撰写一个完整的支持程序库。这段时间的积累是富有成效的。事实上,从近期投出的paper看来,那时在知识体系和思维方式上的收获已经深入渗透到paper当中,而paper涉及的实验的迅速有效的完成也得益于在所准备的程序库。

    真正意义的战斗始于7月中下旬,那时候关于ECCV的工作已经展开了。今年下半年是这个领域的conference的繁忙期,最主要的是9月26日截稿的ECCV'06和刚刚截稿的CVPR'06。有些人也许对于我在两个多月独立完成5项新的topic,在这种有重要国际影响的会议上投出7篇paper(另有两篇属于ICCV前的工作)感到疑惑。但是,从时间更长的积累过程来看,这不是一个很过分的数字。事实上,所有的这些工作都是一项接一项踏踏实实地做出来的,并不是一种凑数字的灌水。虽然我不能保证每项工作都能得到reviewer的认同,但是我深信所做出东西都代表着某方面研究的一个有价值的进展。

    回首这几个月,我发现我在做研究的思考方式和价值取向上已经发生了很深刻的变化。从在微软intern的时候起,直到一年前,我一直比较热衷于采用最新潮的数学模型和方法,并以在文章中堆积很多炫目的方法为荣耀;而到了最近,虽然我对于新型的数学工具仍旧抱有热情,但是所做的工作的主要目标已经不一样了,现在我更倾向于采用确实有道理的方法去解决一些尚未得到有效解决的问题,而不是刻意追逐新潮。实际上,一个问题到目前尚未解决,往往还是根源于现有方法论中的某些根本性的弱点。因而,要解决这些问题,必然要求探索新的模型和方法。我认为,当创新根植于实际问题之中的时候,它才有深厚的基础和不易枯竭的生命力;而盲目追求流行的新方法,生搬硬套,削足适履,往往使得工作华而不实,而不能为所在的研究领域提供真正的价值。

    我曾经认同这样的观点,为了创新,我们不要读太多的文章,读了一定数量的文章,初步了解一个领域之后,就要开始自己想idea了。我现在逐步认识到这种做法是片面和局限的。诚然,丰富的想象力对于创新有着重要的意义,而敢于突破现有的架构才能做出重大的创新。可是,这并不代表着我们不需要深厚的积累。事实上,对于一个能够积极思考的人来说,积累并不构成对创新的束缚,相反,它是创新的源泉。只有当开放性的思维和建基于深厚积累之上的深刻理解结合在一起的时候才能创造出真正有价值的新思路,而脱离了积累的所谓“创新”往往只是不着边际的天马行空。这里谈到的积累的过程,并不是机械式的接受,而是在阅读文章的时候同时思考当前研究领域中各种方法的区别和联系,体会别的研究者进行创新的历程,发掘现有方法体系中存在的问题和它的根本原因。

    对于所在领域的深入全面的了解和思考是积累的关键一环,除此以外,广泛涉猎也有着非常重要的意义。这几个月时间里,我读了六七百篇文章,遍及computer vision和machine learning的诸多领域。这个过程中,我对此的体会尤其深刻。 当你从一个领域迈向另外一个领域的时候,你会发现,原来还有这么奇妙的世界。这种广泛的阅读,将有效地打破原有领域对你的思路的局限,使你的思维开拓到一个非常广阔的空间。这使你能站在一个更高的高度上,从更广阔的视野去审视你进行的课题。

    真正有意义的研究并没有捷径可走,长期不懈的坚持,广泛深入的积累,和积极的开拓性思考都是非常重要的要素。
     
    November 02

    人生·尺度

     
    人生不是一个平滑的图景,从不同的尺度观察,我们会看到不一样的景象。
     
    伟大的思想家,他的眼光如此的深邃而辽远——她看的不是单个的生命,而是浩瀚的宇宙中历史的流逝。在这个广阔的空间中,渺小的个体仅仅是其中一个个小点。无数的点在闪耀着,形成了那美丽的星空。每一个星点都在不断地诞生和消逝,可是,整个星空却在倔强地延续着永恒的梦想。
     
    一个雄才大略,深谋远虑的成功者,看到的是百年的人生长河。他明白,无论中间多少回环曲折,滔滔的河水最终将东流入海。当一个人具有了俯瞰人生的宏大气魄,就不会被眼前的困难和挫折打倒,到达范公所言的“不以物喜,不以己悲”的境界——支持他不断前进的源泉,在于他对人生脉搏的坚定把握。
     
    一个情感细腻的小说家,更多的是把他的眼睛聚焦在生活的每一个瞬间。在他的眼里,纵使是平淡无奇的生活中也充满着美。以举手,一投足,一花,一草,一木,透过他们的放大镜,都折射出无穷的意境。善于发现生活中的美的人,最懂得如何去创造和享受生活,体验其中带来的乐趣。
     
    朋友,当你感叹与生活的平淡的时候,何妨换一个尺度去体察我们的生命呢?
    无论是高瞻远瞩,还是细致入微,不同的尺度,意味着别样的精彩。