第 第 期 月 日
针葬机与应用化毋 叮
,
, 的 卷
年
细胞 信 号
转
导 网络输 入 信 号
的
最
优
实
验
设
计
贾建 芳
’, ,刘太
元
’,岳 红
, ,王
宏
’中 国科 学院自动化研究所, 北 京,
中北大学 自动化 系, 山西,
太原,
摘 耍 细 胞信号转导 网络 的结 构复杂,
规模庞 大,
具有高度 非 线性,
数学 模型的参数和变量数目很 多,
有效估 计 未 知参数 是 系 统生 物学 主 要 的研 究 问题 之 一。
提 出以 信息 矩 阵和估计参数 的协 方 差 矩 阵为 基 础 利用不同 的优 化 实验 设 计方 法, 研 究 一
信号转导 网络翰人信号 初浓度 的最 优设 计 问题,
分析模型参数 的 信区间,
为参数估计设计优 化 实验。
仿 真结 果表明,
采用 一
最优 实验设 计准则,
获得 翰人信号 初浓 度 为 卜 ,
能够提供较 多 的实验信息,
提高参数估计 的精度。
关 词 最 优实验设 计 信息 矩 阵 细胞信号 转 导 网络 参数估计 中圈分 类号
文 献标识研
文章幼号 ・ 一
而
, , ’, , ‘
吮 , , , , ,
勺 , , , ,
吧
,
盯 。,
叩
・
・
, , 卜
盯 , , 。,
, ,
可, , 一
引 言
细胞 信号 网络 具 有 很强的非线性,
随 着模型复杂 程 度 的 增 加,
参数 的数量 更 是 成倍增 长川。
模型参数一般通 过 生 化 实验获得,
但测 盆 数据 的不 完 整和测 量 噪 声 的 干 扰, 直 接 妨 碍参数辨 识。
在细胞 活 体 内精确 测童 内源性 蛋白质 的 浓 度 往 往 十 分困难。
此 外,
一些生化反应 的动 力 学参数也 难以确 定,
即使在试 管 中利用 纯组 分 通 过 实 验测得了速 率 常 数, 也 可能与细胞 活 体 内的动 力 学参数 截然不同 ’】。
因此, 通 过反 应 机 理和实验分析,
根 据 不 同 的 研 究目的,
如 何 建立系 统的
“
核心”
数 学模型,
求 得 系统 的 关 键 组 分和关 键反 应, 有 效 辨 识 模型参 数,
已经成 为 系 统生物 学 的研 究 热点之一〔’ 。
实 验设计是 实验 过 程 的 依 据,
是 实验 数 据处理 的 前 提, 如 何 优 化 实验 设 计、
提 高实 验 效 率、
提 取 更 多 的 实 验 信 息 是 人 们 广 泛 关 注 的 问 题。
在 做一项 实 验 时,
实 验 条 件诸 多 限 制,
例 如 输人信号 的类型、
输人 和 输 出 的 振 幅 或 功 率、
允 许
收稿日期 刁 一
修 回日期
供
刁资 助 中 国科学院海 外 杰 出学 者基 金资助 项 目 一
作者简 介 贾建芳 一 ,
男,
山 西 人,
博士研 究 生,
讲师
持续 进 行 实验 的时 间、
最 大 和 最 小 的 采 样 速 度、
采 样 频 率 等 的 限制〔‘ 。
输 出信号 的侧 量 受实验 技 术和检 测 仪器的制 约, 因此,
当选 定一种 实 验 信息 的 盆度 准 则之 后,
对 输人信 号和 采 样 颇 率 做 有约束 的 最 优 化 计 算,
从 中得 到最优的实 验 设 计。
实际应 用 中,
通过 计 算机采 样一般 是 等 间 隔 的, 因此最 优输人信号 的设 计 问题 成为 系统辨识 实验和设 计 的主 要内 容。
文 献【 〕就水处理 过 程 的参 数 估 计,
分 析 实 验 设计 的 自 由度和约 束条件,
研 究不同条 件下的 最 优 实 验 设 计, 说 明 实 验 的信息量极 大 依 赖于实 验 设 计,
通 过改变 输人 的 初始浓 度,
延 长间歇 反应 操 作 的 实 验,
能 够 提 高参 数 估 计的精 度。
文 献 仁 研 究 应 用 在 系 统生物 学 中的 最优 实 验 设 计, 设 计
一
信号途径 的输人信号,
讨 论 各 种最优 实 验设计 准则的优 劣。
为了估 计 信 号 转 导 途径模型 的参 数,
文 献 〔 〕 讨论 参数 估计 的 数值方 法,
什其机与盛用化毋 的,,
据 中获得更多信息,
降低参数辨识的误 差。
同时考 虑初值、
采样时间、
时变和时不 变 变 的值,
以及实验 时 间等约束的 羞 础上,
文献【 设计 了墓于系统 信息矩 阵 的评价 函 数,
仿真表 明在相 同条件 下,
最优 实验设 计找 出更有价值的 信息。
文 献〔幻从概率论 的角度提 出一种 新 的研 究思路, 假 定辨识参数与概率分布相符,
如何设计物人信号使辨识参数 以 一定 的概率落人 某一 区间,
以便获得容易控制的概率。
文 献〔 」提 出以 信息矩阵和 矩 阵 为基 础,
分别 估计生态系统非线性 动态模型参数的 信区间,
阐明它们的 主要差别在于摘出函数的二 次导数项。
本文以 。诱导 信号转导 网络 为 研 究 对象,
讨论以 信息矩阵为基础 的最优实验设计准则,
研究物 人信号初浓度 的最优值和参数的 信区间,
通 过信号 转 导 网 络 的计算机模拟 为优化实验设 计提供参考依据。
艺
勿
‘ 『 一,勿 ,‘
〕
荟
。。, “ 一, ‘ 。。
二 、’
占,
二二二竺口 一’
二二乙止二 吞口
州
一 一口
二 。
号
竺
垫立
口一【竺
业
坛
州
一口
二 占 占
廿二 。, , , 。、
右
‘ 。一, ‘ , 。 ‘
其中 口 二 、’
二二兰二 一‘
二止之二 称
户二
信息
矩阵
,表
示在 噪声情
况 下侧
模
型参 数
可辨
识性 的
信
息
度
,反
映
参
数 向量 变 化
和与
之 对 应 的
观测
量
变
化之 间
的关 系
,而 且
它
还有
一非
常重
要的性
质
,是
一个 半
正定对称矩
阵
,其
所
有
特征
值
非
负
。令
最 优
实
验 设
计 方
法
细胞信号转导 网络 为 非 线 性 动 态 自治 系 统,
状 态 方 程 为
无 , 二 二 , ,。,
口 ,二 ‘。, 二 二 。
物 出测 方程为
‘,
口 二 ‘,口
式 中, 。
’ 为系统状 态变 向 , ’
为系统侧 量 输 出,
。
为棋型参数, ・
是 描 述 系统 结 构 的 非 线 性函数, 矩 阵 选 择 系统 的可 观侧 状 态。
在初时刻‘。,
状态变量二
的初 值为 。。
当模型参数 未 知,
参数估计 的目的是 发 现一组 尽 可能使模型预 侧 和实侧 数据一致 的参数值。
假 设参数 的真
实值 为 ,
估计值为 ,
则性 能指标函数为
,
‘
卜
专
客
客
〔, , ,,
卜
, ・ ‘,‘
〕式中, , 。,
表 示参数 为 真 实值的实 验 侧 数 据, 目
‘,
表示参数为估计值 时通 过棋型计算得 到 的数据, 二 , ,
…,
表示 可侧 状 态 的数目, , ,
…,
表示采 样 数 据 点。
为了获 得 参 数 的 估 计 值,
就 是寻找 使 性 能 指 标函数
云
最 小 的参数值,这样参数估计就转 化 为最优 化 问题。
由于细 胞 信 号 转导 网络 的参 数很 多,
单纯采用常 规的最 优 化算法计算 极大,
耗 费 时间极 多。
因此,
在参数 辨 识 前 预先分析系统模型 和 系统 参数,
研 究其敏感性, 引人 信息矩 阵,
利用 优 化 实 验 设计 准 则 确 定 最 优 输人信 号, 为实 验过 程提 供指 导,
有针 对 性 地 侧 量 实验 数据,
节 约 建 模 时 间 和成 本。
信 息 矩 阵 考 虑
系统
模 型 ,由
参 数
向 量 微 小的
改 变量 韶 而 致 , 时
刻
观 测 向量 的改变
量 为旦
毕具
,则
信
息
矩阵
。 可 以表 示
沙
} 『 ‘
为
尸
甜
二口
一’。, ‘ 二
恻
拱
占口口
式 中
,称 为绝
对敏 感
性 矩阵
, 二 ‘称
一」
「口子
为测 量 协 方
差 矩阵
,其 中
‘ ’二 ,
。
。
亨
,表
示系统
测量
状 态的个 数
,表
示采样 的个 数
,。‘
表
示第
‘个测 量状 态在
第
个 采样 时
刻
的标
准
差。估 计 参
数的
工信
区 间 在试 图估计某参数之 前,必 须 判 断其可 否辨识,
实际 的 可辨识 性 受制于侧 量 噪 声和侧 数据,
如 果 有 较大侧 误 差,
或者 只有很 少数据,
那么参数估计就不 可 靠,
称 为实际不 可辨识。
根据 数理统计学 的 一
不等式〔川 ,
估计参数的 协方差 矩 阵
艺
能够表示 为艺
, 一,协方差 矩 阵艺的对 角元素,
给 出 了估计参数的方差。
因 此,
当等式 成立时,
称 参 数估 计 达 到了 一
下 界, 它 为 信区间的估计和动态 实脸 设 计提供 了理 论依据。
当侧 嗓声 服从 商斯 分 布 时,
则 估 计 参 数 ‘
的 信区间可
以表示为
‘一 ・
, ,‘, ‘ ・
。一‘
其 中,。‘
表示第‘个估计 参数 的标 准 差。
因此 在估 计 参数 的 信区间 内,
当参数 值 为零 时,
该 参数 就 是不 可辨 识 的。
估 计 参数 的相对 误 差 为 因 此,
如 果 测 量 噪
声
服 从商
斯 分 布,则 在
【
‘, ,…, ,
〕
时刻
观 测序
列 的总 改 变 量定 义为
・
叮一
火, 二
,
贾建芳等 细胞信号转导 网络物人信号 的最优实验设计
最
优
实脸
设计
准 则建立细胞信号转导 网络 的数学 模型,
精确辨识模型中未 知参数是 系统生 物学墓 本任务之一。
然 而,
信号转导 网络 的 组分 多,
反应 本身所 表现 出 的强 非线 性,
以及 无 法 获 得 完备 的实验 数据等原 因,
都使 系统棋型的辨识 变 得 困难。
实测信 息度 能够用 估计参数 的协方 差矩阵
艺
来 表示,估计参数 的 信区间越小,
实验 包 含 的信息 就 越 多。
因 此,
可以利 用
‘
信息 矩 阵 口 和 估计参数的 协方 差 矩 阵
艺
, 以参数辨识精度及物 出空 间误 差作为优化依据,
研 究 细 胞信号 转导 网络 的优 化 实验设 计。
基于 信息矩 阵尸刀甘 的实验信息度量 测 方式分 别为’
一
最 优设 计 准则, 简称 一
准则
, 一,
・
最 优设 计 准则,
简 称 准 则
一
最 优设 计准 则, 简称 一
准则 一
修正 最 优设 计准 则,
简称 修正 准则
真运行 小 时, 观 察 ,
所 示 的 一
产生 周期性振荡。
阶跃信号 的变化曲线和 , 表示 的 ,
在 作 用 下 的输 出信号变化 曲线分别 如 图 和图 所示。
表 一
信号转 导网络的状态变 初 始浓 度
曲 日 扭 颐
・
‘目 记
目 目 目
, 以 ,
名
名一 劣一 一,
公
公 民 “ 名
名 , ,
万
万一 吠 ‘ 一‘ ・
名
名 。一 一民 ,
日・
,,。 吠 ・ ・
民 一 陇一 名
名 陇 一 ・ , 陇 ・ ・民
‘
‘ 一
, 陇 ・ ・ 名
名, ・ 陇
二 一陇
‘
‘一 陇 民 ・ ・陇 ‘ 民 ・ ・
民 咤 。二 ・
民
电
认 住
芝
导伙一
人一 了解 口
。‘
刀肚 其 中,
尸刀甘 口 一’
表示 信息 矩 阵的逆 矩 阵 的 秩 尸刀甘 口 表示 信 息矩 阵 的行 列 式, 。。
刀甘 和
二 尸刀甘 分别表示 信息矩 阵 的最 小 特 征 值和最 大特征 值。
设计辨识 实 验箱要考 虑 选择可侧 的输 出状 态、
测 量 时 间和测 量 频 率 还 需要 考虑以何 种 方式 控制翰人的变 化。
一 般,
测 输 出的选 择受实 验 仪器 和 实 验 条件 的 限 制, 实 验 设 计 的 自由度 仅仅体现 在 输 人函数 的设 计,
因 此,
优 化 实 验 设 计可简化 为寻 找 能够产 生 最 大实验 信息 度 的 输 人函数。
另 外,
对于非 线性 模型,
由于 信 息 矩 阵 是 与模型参 数 有 关,
所以优化实验设 计受模型参数的影 响,
当参数值变化 时, 优 化实验 设 计 也 需 要相 应 改 变。
而
溉 护目
图 抽 人信号 变 化曲线
公 雀日
以
}
”
芝
荟才
内
脱 ・民 目
图 箱 出信号 一 变化 曲线
最 优 实 验 设 计 选 择 状 态 变 量 ,
表示的反 应物 一
作 为 系 统 的 输 出信号,
状 态 变 表示的反应 物 作 为 系统 的 阶跃 抽 人 信 号,
则 一
信号转 导 网络数学 模型表示为
二 二, 二 ‘。 二 。
名下
口
亡‘
细
胞 信 号
转 导
网
络仿 真
研
究
・
信 号
转
导 网络一 一
是 普 遍 存 在 于各种 细胞 类型中的一种 核 转 录 因子,
调 节 参与免疫 反 应和 炎 症 过程 的各 种 基因 ’一’礴
〕。
利 用 等建立的 诱导 ・
信号转 导网络 的数 学模型作 为研 究 对 象, 模型 包 括 个反应 物和 个生化反应 ‘”〕,
其 中 个 反应 物 是 动 态 的,
它 们的浓 度 被 定义为状 态 向量 二
【气
二
〕。
表 是 个 状 态 变 量 所代 表 的反应 物 及 其 初 浓 度 ”,
” 。
根 据 表 的初 浓 度,
系统模型仿真运行 小 时后, 达 到 穗 定,
保存此 时 个 状 态 变 值作为新 的初 值。
然后, 给状 态 变 所示反 应 物 施 加 幅值 为 的 阶跃 扰 动,
仿
一
信号转 导 网 络 包 括 个 模型参 数,
经过 敏 感 性 分 析可知,
参 数氏、
氏和色‘
是 测 量 翰 出信 号 一
什弄机与盛用 化母 的 ,
、 产 、 口 、
口
、龟了
,
口 夕
二 ‘ 二,
且
,
矛 ‘矛、了矛、』
‘、
,,月 月
’
刁
敏感今数【”〕,
其真实值分别为 、
。 、 ,
它 们代表的速率常数分别为
氏 , 一 ・
回 , 一’
‘
加
山 ” 瓜 ,卜 一‘・ 一’ 一 ‘ , 一 。为 了分析方便,
只考虑估计敏感参数 , 、‘和气的最优 实验设计。
利用参数 敏感性分 析法 ’‘・‘,〕,
翰 出 关于参 数 ’、
‘和人的绝对 敏感性函数 可以表示为
刀材 口
朋
一,二
…
麟
二
蒸
一
卿
护胡
心勿
护一
脚 一,
确
一
魏 一,
一民
期
汀翔
夕丘
拙
护,
一
砚 么 盆
丢
孔
轰
‘盆
,,
轰
‘,扎
,,‘ 一,
口
人。‘ 口
。。 口
。, 夕了朋 口
二 一‘
二 刀
二 ,
品,
的,
自,
二
尸
} }
二
“
肚‘‘ ‘
二
其甲 抓“〕二 二 , ,‘
表尔 米样时 到 二 , ,
…, 。
竹 ,・
仿真实脸采 样 时 间 为 分 钟,
采样 个数 二 , 故 。
翔 ’。
假设 侧 嗓 声 服 从高斯 分布,
则 信息 矩 阵可 以表示 为
‘ ‘, , 二
豁
’。一豁
假 定 阶 跃 抽 人信号 初浓 度 的 变 化 范 圈 为 【 卜 , 卜
〕,
初 浓度变化时,
则根据不 同的设计准 则,
研究 一
信号 转导 网 络箱人信号 初 浓度的变 化 对估计参数 的 工信区间 的影 响,
寻找最 优 的翰 人 初 浓 度。
按 照 一
准则、 一
准则、 一
准则和修正 一
准 则等得曲线 如 图 所示。
图 中的垂 直 虚线分别表示 刀甘 一’ 、
尸刀甘 、 一 。 夕刀甘
口 和
协方 差矩 阵 中的叭 二 、
心
今, 尹,其 中。表示 侧 量
相对误差 系数 刀 表示 侧 绝对 误 差值,
忿
凡,表示第‘个 状态在 采样时刻 的侧 值。
按 照 ・
准则、 一
准 则、 一
准 则和修正 一
准 则等 个 准 则,
抽人信号 初浓度为。 卜 ,
则参数 ,
、
气和人为真 实值时,
得
人。。 尸
甜 人。‘
甜
卜
对 应 ”‘ 人“ 号 ”最 优初 浓度值,
其 中 一
准则、 一
准则和 一
准则 条 件下 得翰人信号 的最 优初 浓 度 为 林 ,
修正 一
准则得输人信号 的最优初 浓 度 为 卜 。
。
辉
姗朋 护, 一牌爬 七 加( 芝 一多』)
户 办 二 肠卜
峋皿
…
…
…
…
…
盔}」封) 详
砚 拓
众 众
鸿
即加石。 林
峨旧 如向”
加石目 石 期
护 “盯 《, 咐一“姗翻
优 “。
,
山 皿 }
芝 工』) 才盏,』)
李
仪琳
盏』) 才
之 月
咖晰加心佣 小
夕
伽渤的石 扭
够 二 对 阔 。如石。 成
,
贾建芳等 细胞信号转导 网络翰人信号 的最优实验设计
}
一
洲
制
划
训
翩
目
, 数
估 计
结 果为 了在 二 维空 间直观 讨 论 参数 变 化,
这里只估计 个参 数,
分别估计
舀
二 ,民
、瓦
‘,礼
和瓦
,子
、 的 种 情 况,其
它参数 为定值。
按 照修正 一
准则,
得翰 人信号 的最 优初 浓度为 卜 ,
而其他 个准 则 获得 翰 人信号 的最优
初 浓 度为 卜 ,
分别在 这两种 情 况 下 估 计 参 数 对 ,
夙
、礼
,夙
。 和民
,礼
的 , 信区间,如 图 所 示。
与
・
准则、 一
准则及 一
准则条件下 得翰人信号 的最优初浓 度相比,
根 据修正 一
准则得 的箱人信号 最 优 初 浓度估计 参数时,
估计参数
夙
,子
, 、民
,礼
和瓦
,子
、 的 置信
区间放 大 了,
说 明实验包含 的信息 减少 了。
根 据式 式 计 算 估计参数 的 置信区间 和 误 差,
结果如 表 所示。
参数误 差 的 分 析,
按修正 一
准 则 所 得 的误 差,
比 一
准则大。
例如, 一
准则下 的参数 二和
, 的误 差
分别是 、
而修正 一
准 则 的 误 差 则 为 、
,
误差分别 增 加 了 和 。
因此,
针 对
一
信号转导 网络,
为 了提 高参数 辨 识 的精度,
可以根 据
一
准则,
选择 阶跃输人信号 的初 浓 度 为 卜 。
表 估计今数
民凡
、凡
二礼
和 〔民
,礼
的 信区 间山 浦 以 山
口”,
凡 、 , ”
几 气
”肠 创 口加加曰目
呷血目‘妙 礼 ,期,
柳
礼
嫩
溯
。礼 , ,犯
舀、【。
姗
叫”〕礼 期 似, , 舀、。
【。叨”,。
姗
】目,厅肠
,
‘,
,
吕
目日五目 仰血目妇
亩二 一的 砚 ”
礼 ,, ,
心”
坛 一, ,脚
从 的 ,,
瀚
」礼 侧, 叨神
一
一
赫
毓
响
二一, 二, ,
】七
—
招云 断
,,、、,
月
『,
占
了书七,,
乃
产 尹尹
一
厂
歹
夕。。 。
卜
‘刀 乃
翻
一’ ‘ 山
, ,
一
成
,
‘闷
产产尹尹
—
心 公 加 云 一 妞
刀
叮
“泪
力
一
,
—
祀 址行朋一
触 ‘噢
性几一
“ 、 、产 产 、 、、,‘, ,
‘
,
、、
汉 七 书 ‘巴
、、
一
一
尸』 吕 气,
‘
…
,
…
‘}』 飞}』
刀 刀
也 几
‘ “一 伪
民
,宕, 、
瓦
,瓦
。 和民
,宕、
峨 颐 一
朋・
图 不 同实脸 设计准则 下今数
瓦
,民
、凡
,夙
和
民
,民
。的 信区 间
结
论
分析川 一‘
信 号转 导 网络 的 数学 模型,
选 择川尸‘
为 系统 可 侧 翰 出信号,
为 阶 跃 输 人信号,
以 信息 矩
阵 和估计参数的协 方 差 矩 阵
艺
为 基 础,研 究 各 种 准则 下,
阶跃 翰人信号 初浓 度 的变化对今数估计精度 的 影 响。
在 一
准则、 一
准则、 一
准 则 条 件 下 得摘人 信 号 的 最 优初 浓 度为 卜 ,
而修正 准 则 得抽 人信号 的最 优初 浓 度 为 卜 。
仿真结果显示,
根 据修正 一
准 则 会 导 致估 计参数 的 信区间 增 大,
所以,
实 验可用 准 则, 选 择 阶跃 翰人 信号 的初 浓 度 为 林 。
细胞 信号转导 网络 的计算机 棋 拟 表 明 实脸 的 信息 大 大依按于设计 的实 验,
通 过 改 变 翰 人 信 号 的 初 浓 度, 参 数估计误差 显著降低。
当然,
抽 人 信 号 的初 浓 度,
因 辨 识参 数 的不 同而发 生 变化。
因此,
在实验 数据
孚
集 之 前, 选 定 形 响 系统 辨识 精度 的各个 因素,以达 到最优 为准,
同时 综合考 虑 实 验 条件、
数学 论 证 和 实 施 方 法 等 的制 约,
根 据 适 当的 准 则,
合理 安排 各种实验 因素,
严 格控 制 实 脸误 差,
有效 分析 实 验数据,
从 而用 较 少 的人力、
物力和时 间,
最 大 限 度 获 得 丰 富 而 可靠 的信息。
目
助 一
, ‘ 一 一
“ 一, , 一
一 肠 。
卿 一 一
己 ‘, 以洲,
,
一
一 盯,
峨 旧 口 脱 助 一 一 一 一
一 ・ 一
。朋记 “ , , 一
沙 ,
目 二
一
一
即 如 花 , ,
计薄机与盛用化毋 加 ,
, 卯
山 ,
朋
二
叨 比习一叩公
目 砂 目 咖 。二
加 肠 ,
的 ,
一
, 一 ‘公 ・
的 ’ 呱 ”幽 汕粉
一 一 一, , 一 一 一花
助 “ 一
, 叩 也 ・
。妞 目
心 的 , 一
助 曲 竹 吐 , 邵石口
加 比 一 访 ‘
助
, 一
・ ,
朋 卜 心 花
一 哈 一 认 ,
, 一
一 二 访丽 ,
,
砂 肠, ・
助 仆姻 丽朋 叮
阮 ,
一 ・
一 二
的 ,
任口仙 ,
玩 ,
仆 陇 ・ ・民
间 叨 梦 鹅石丽
, , 一
二 ,
公 二 公二曰 成
・
, 叮 份 目 盯 以润,
一
价 份曲一 ,
恤
目 一 ・目 花 叨 ‘ 叮 , 目叱 一
民 陇 公 盯,
砚洲】, 一
功 助 一
一 朋
毗 , ,
一
, ,
沙 访 山 加
一 一沈 盯口记 肠 “ 一
曲山
一
峨
助 ・, 以 , 即 盯