网络的层次耦合不是随机的,而是经过一定的机制筛选后形成的有意义的模式,如同波函数的坍缩。因为随机必然会产生一定的分布,而分布函数的特定区段相对于其他区段具有更强的环境适应性,因此如同自然选择的过程中剩余下来,这就是进化。这种路径的坍缩还是进一步发展的前提,即贝叶斯公式的前验概率,在一定程度说明了路径依赖的存在性。
具体的数学模型就是序列匹配识别,如细胞之间配体和受体的识别。这是参考免疫系统的识别方式:1多层次,细胞、组织、器官的识别;2层次分化,中枢免疫器官和外周免疫器官的概念的相似性3层次互补,本质上是多层次的竞争博弈形成的均衡,固有免疫和适应性免疫;4层次的选择性表达,免疫防御、免疫自稳、免疫监视
序列识别是多层次的,不仅仅是结构,还有基于结构的功能。我们先弄基本的结构,在以此为基础形成的层次的遍历来选择性表达为功能的识别。根据分形结构的假设,其具有一定的相似性。如同逻辑电路,不同层次的封装需要一定的接口。
抗原和抗体。抗原与T细胞、B细胞的TCR或BCR结合,促使其增殖、分化,产生抗体或致敏淋巴细胞,并与之结合,进而发挥免疫效应。这是网络的路径形成。具体的路径形成就是我们探索的各种机制,如胸腺依赖性抗原(TD-Ag)刺激B细胞产生抗体时依赖于T细胞,胸腺非依赖性抗原(TI-Ag)直接刺激B细胞,无需T细胞辅助,能产生IgM类抗体,无免疫记忆。这是网络的层次耦合。
于是我们来到细胞层次,T细胞B细胞巨噬细胞等等的特定组合可以产生一定的效应,即各种免疫机制。
当上升到组织器官层次,胸腺与细胞免疫密切相关,与体液免疫也有很大的关联;脾是人体最大的外周免疫器官。
经历了一次从底到顶,我们该开始新的从顶到底模式。
在一定意义,我们可以认为细胞可以选择性表达为其表面标志分子的序列,如T淋巴细胞表面标志有T细胞分化抗原:CD3、CD4、CD8、CD28。不同的细胞我们都可以根据这个定义来规定其独特的身份,如同对空间的不同点的定义。然后不必太细胞的相互作用可以抽象化为这些序列的交互。当我们收集足够多的数据时就可以发现一定的模式,即免疫的分子机制了,这是统计层次成立的规律。
TCR不能直接识别抗原表位,只能特异性识别抗原提呈细胞或靶细胞表面的抗原肽-MHC分子复合物。这也是一种高维的识别模式,其是一种有特殊要求的接口,有助于整体的模块化。
T细胞分为CD4+和CD8+两类,CD8+T细胞是介导细胞免疫的效应T细胞,经抗原致敏后可特异性杀伤携带致敏抗原的靶细胞。CD4+T细胞分化的Th1细胞、Th2细胞;Th1细胞分泌IL-2和IFN-γ,Th2细胞分泌IL-4、5、6、10。细胞的分化(多层次,T/B细胞也是一种免疫细胞的分化),其层次的遍历可以形成不同模式,如细胞免疫和体液免疫等等。而B细胞不仅能通过产生抗体发挥特异性体液免疫功能,也是重要的抗原提呈细胞。这就形成一定的概念互补。我们认为这是网络的代偿机制的源头,即层次可以构建一定的等价关系。
分子分布的偏好性如MCHⅡ类分子分布在树突状细胞表面也是一种接口,有助于免疫功能的有序进行。我们可以抽象为特定序列的功能。
抗体是序列识别的一部分,通过与相应抗原特异性结合(结构层次的序列识别),发挥体液免疫功能。
抗原抗体的结合是结构层次的序列识别然后导致其他功能的变化,而细胞因子是通过相似的功能层次的识别发挥其功能,如白介素-1、6(IL-1、2)可引起发热是宏观层次的关系,可以进一步分解为细化的关系序列
白细胞分化抗原和黏附分子等等是其他层次的识别,不同的识别抗原产生不同的效应。
以上的层次的遍历耦合可以构建高维的结构,即免疫应答。不同细胞分子的选择性组合形成的具体路径是宏观的识别、活化、效应三个阶段。其选择性表达的机制可以理想化为一定的序列,如其选择性表达可以形成免
疫耐受和超敏反应。而各种免疫疾病是我们研究免疫系统的一个方法,即我们观察每个部分的缺失可能导致的效应来推测其在网络发挥的作用,如免疫缺陷。
免疫网络的选择性表达可以是肿瘤的发生,即在不同环节的选择性表达(抑制/激活),这种情况可以表达为一定的序列。对我们具体的治疗有指导意义,即选择有意义的组合施加影响使得整体平衡移动到健康的状态。理论上的药物应该锚定这些序列的不动点,如抗CD20单抗来治疗非霍奇金淋巴瘤。当然一般情况我们还是需要找到多个具体的靶点来综合作用,如鸡尾酒疗法。
基于随机假设的Hardy-weinberg平衡定律所揭示的各基因频率和各基因型频率世代保持不变是现实世界的依照理想,可以以此为边界来对现实世界做比较定量的解释。我们从随机独立的假设里来,到层次耦合里去。
遗传算法是模拟自然选择的过程,对更具适应度的序列允许其大规模地增殖,重复这个过程可以看到一定的进化,如同我们的现实世界。由于变异的存在使得Hardy-weinberg平衡定律是理想情况。
遗传的杂交是宏观的序列运算,可以理想化为粗颗粒度的基因的重新分配,这也是一种不动点的思想。当然这是序列的单个元素的运算,我们的目标是一整行的序列的宏观因素,这需要的指标判断等等我们打算参考生物信息学的打分矩阵思想。
疾病本身可以表达为多序列的耦合,我们可以通过对序列的处理来做到诊断、预防和治疗。当然这个前提是我们建立这个数据库,如同基因组对细胞的基因序列的测量。扪心自问,我们走到道路和功能基因组学是一致的,只是我们选择运算的序列很不一致,他们是从底到顶,希望对基因的研究一直遍历形成高维的人体机能研究;我们希望的是从顶到底,把复杂的人体变化不断分解为不同范围的层次。当然我们终将相遇。
相比与其他的疾病,我们认为遗传病是比较底层的,即机体的代偿概念发挥的用处不大,使得我们有能力观测特定的变化能够在宏观的层次发挥的作用。这种高概率的相关性对于数学的推导比较友好,如唐氏综合症是21三体综合征。我们暂时不用考虑环境因素和遗传因素交互作用。当然我们只希望能够以此为基础构建序列数学结构来解释这种相互作用的,但是现在还无能为力。
血型的分类就是机体网络的序列的一种例证,而这些序列的竞争可以与基因和基因型的发展即Hardy-weinberg平衡定律来解释其最后的均衡状态。
如同地中海贫血、镰状细胞贫血等等都是比较底层的,接近中心法则的,我们对中心法则的应用对于疾病的解决有着极大的意义。这就是基因治疗的斩草除根的思想啦。我们不一定要做到基因的转导,可以通过RNA的对基因表达的调控也可以起到一定的作用。如我们可以通过在体内外置一个细菌工厂来持续施加影响,或许能够保持机体的健康生活状态。因此我们需要找到运算的对象,之前一直都是找到确切的基因和酶,我们认为这是一种不动点的确至关重要,但我们可以采取一定的替代的方式即找到更大范围的相关的基因和酶来通过贝叶斯公式把其影响堆积到一定高度。
那么这种序列如果被观测理解呢?我们需要引用中心法则的一些关系来构建这种数学结构。即我们需要一定的可重复的研究来证明其与一般的结构性的序列(ACGT)的等价性。算法的复杂度是否可以作为一种度量?因为序列内部的耦合和模式涌现也是重点。
系谱分析可以视为是对不动点的分析,可以作为序列的一部分来处理,当然对序列整体的研究是大规模的大量级的。其中单基因的显隐性是序列的选择性表达的结果。完全显性和不完全显性和共显性和不规则显性和延迟显性和从性显性都是这种选择性表达,即都是概率的表达。
而多基因遗传病则是序列运算的一个很好的例子。可以分解为亚层的模块:各对等位基因对遗传性状形成起一定作用,共显性,累加起来可形成明显的表型效应(如同微积分)。各种分布的函数就是序列的分化,而根据其具体的位置来制定一定的阈值可以简化为单基因。
具体的位置确定是对有意义的序列的处理,各种荧光染色等等手段可以在宏观上确定。当然,SNP可以视为BLAST算法的seed序列的寻找。
由于分形结构的层次相似性,我们能够在群体水平的频率来发现个体水平的各种规律。平衡定律应该是普遍存在的,这可以接受序列的竞争博弈达成的均衡。而且基因的定义所用到的探针也是利用序列的相似性来耦合,只是遗传病的诊断需要更高维度的序列匹配,如一系列的症状和检测。