❶ 广播模型、扩散模型与传染模型框架
【书籍/课程名称】广播模型、扩散模型与传染模型
【类型】
[x]书籍目录框架/课程框架
【关键词】
* 广播模型(一个信息源),扩散模型(口口相传),SIR模型(考虑痊愈),易感者、感染者、痊愈者,巴斯模型,前提假设,概率分解,基本再生数R0, 疫苗接种阈值,群体免疫力,依赖于环境的临界点,直接临界点
【框架】
* 我们运用广播模型、扩散模型和传染模型分析信息、技术、行为、信念和传染病在人群中的传播。这些模型在通信科学、市场营销学和流行病学的研究中发挥着核心作用。
* 模型将思想和传染病传播的微观过程与这些采用曲线的形状联系起来。
* 本章中介绍的所有模型都要假设存在一个相关人群,用NPOP表示。相关人群包括那些可能患上传染病、了解信息或采取行动的人。
* 在任何时候,总会有些人患上了某种传染病、了解特定信息或采取了一定行动。我们将这些人称为感染者或知情者(用It表示),相关人群中除了感染者或知情者之外的其余成员则是易感者(用St表示)。这些易感者可能会感染传染病、了解信息或采取行动。
* 相关人群的总人数等于感染者或知情者人数加上易感者人数的总和:NPOP=It+St。
【一、广播模型】
* 在给定时间段内,知情者人数等于前一期的知情者人数加上易感者听到信息的概率乘以易感者人数。由此得到的将是一个r形采用曲线。
* It+1=It+Pbroad×St
* 其中,Pbroad表示广播概率,It和St分别等于时间t上的感染者(知情者)和易感者的数字
* 初始状态为I0=0,且S0=NPOP。
* 广播模型刻画了思想、谣言、信息或技术通过电视、广播、互联网等媒体进行的传播。这个模型的目标是描述一个信息源传播信息的过程,可以是政府、企业或报纸。这个模型不适用于在人与人之间传播的传染病或思想。
* 在广播模型中,相关人群中的每一个人最终都会知悉信息。如果有适当的数据,就可以估计出相关人群的规模。
【二、扩散模型】
* 【扩散模型】
* 大多数传染病,以及关于产品、思想和技术突破的信息,都是通过口口相传而传播开来的,扩散模型刻画了这些过程。扩散模型假设,当一个人采用了某种技术或患上了某种传染病时,这个人有可能将之传递或传染给与他接触的人。
* 在这个模型中,与在传播模型中一样,从长期来看,相关人群中的每个人都会掌握信息。不同的是,扩散模型的采用曲线是S形的。
* 在广播模型中,根据数据估算相关人群规模是一件相当简单的事情。采用者的初始数量与相关人群规模密切相关。与此相反,利用扩散模型的数据估计相关群体的规模可能会非常困难。产品销售量的增加,可能是由于一个很小的相关人群内部的高扩散概率,也可能是由于一个很大的相关人群中的低扩散概率。
* 【前提假设】
* 在传染传染病的情况下,个人的选择不会在其中发挥任何作用。技术的传播则与采用者的选择有关,因此更有用的技术被采用的概率更高。我们并没有在模型中明确将这种情况选择考虑在内。
* 扩散模型假定随机混合(random mixing)。随机混合的含义是,相关群体中任何两个人接触的可能性都相同。如果将它应用于城市人口则是有问题的。在城市中,人们并不是随机混合的。一个假设要成为有用模型的一部分,其实不一定非得十分准确不可。因此,我们将继续使用这个假设,同时保持开放的心态,在需要改变的时候随时改变这个假设。
* 【概率分解】
* 这种事件的发生,因环境而异。我们可以将扩散概率(diffusion probability)定义为接触概率(contact probability)和分享概率(sharing probability)的乘积。我们可以根据扩散概率来构建模型,但是在估计或应用模型时,必须独立地跟踪接触概率和分享概率。
* 应用软件扩散:要想改变第一个概率是很困难的。为了增大第二个概率,开发人员可以为带来了新注册用户的老用户提供一些激励,虽然这样做能够增加扩散速度,但是并不会影响总销量,至少根据这个模型来看不会有影响。如上所述,总销量等于相关人群的规模,而与分享概率高低无关,提高销售速度不会带来长期的影响。
* 【巴斯模型】
* 大多数消费品和信息都是通过广播和扩散传播的。而巴斯模型则将这两个过程组合在一起了。巴斯模型中的差分方程等于广播模型和扩散模型中的差分方程之和。在巴斯模型中,扩散概率越大,采用曲线的S形就越显着。
【三、传染SIR模型】
* 【SIR模型】
* 在我们已经讨论过的模型中,一旦有人采用了一项技术,则永远不会放弃它。但这并不适用于所有通过扩散传播的事物,例如我们患上了某种传染病之后不久就会恢复健康,或者当我们采用了某种流行款式或参加了某项潮流运动之后,是可以放弃的。
* 我们将放弃所采用的某种事物的人称为痊愈者。由此产生的模型,即SIR模型(易感者、感染者、痊愈者),在流行病学中占据了中心位置。
* 为了避免过于复杂的数学计算,我们假设治愈传染病的人会重新进入易感人群,也就是说治愈传染病并不会产生未来对传染病的免疫力。
* 【基本再生数R0】
* 某种传染病,如果R0大于1,那么这种传染病就可以传遍整个人群,而R0小于1的传染病则趋于消失。
* 必须接种疫苗的人的比例,即疫苗接种阈值(vaccination threshold),可以通过公式Vt≥(R0-1)/R0求出。我们可以从上述模型中推导出这个公式。对于麻疹和脊髓灰质炎等R0非常高的传染病,政府将努力保证所有人都接种疫苗。
* 有些人担心疫苗有副作用,选择不参加疫苗接种计划。如果这些人只占人口的一小部分,那么其他人接种疫苗也可以防止这些人感染这种传染病,流行病学家将这种现象称为群体免疫力。选择不接种疫苗的人事实上是搭了其他接种疫苗的人的便车。
* 【超级传播者】
* 如果将SIR模型嵌入到网络中,就会观察到度分布对传染病传播的重要性。
* 对于中心辐射型网络,R0携带的信息量很有限,因为如果中心节点患上了传染病,传染病就会传播开来。流行病学家们将位置在度很高的中心节点上的人称为“超级传播者”(superspreaders)。高度数节点不但能够更快地传播传染病,而且会更快地患上传染病。节点对传染病(或思想)传播的贡献与节点的度的平方相关。
* 【成功与临界点】
* 尽管SIR模型原本是用来分析传染病传播的,但是我们也可以将它应用于所有先通过扩散传播,然后趋于消失的社会现象,例如书的销售、歌曲的流行、舞步的风行,“热词”的传播、食谱和健身方法的流传等。
* 在这些情形下,我们也可以估计接触概率、传播概率和“痊愈”概率,以及基本再生数R0。这个模型意味着,这些概率只要发生了微小的变化,就可以使R0移动到高于零的水平,从而造成成功与失败之间的天壤之别。
* 成功可能取决于非常微小的差异,一件事情做得很好与搞砸了之间,只有极其细微的差异。
* 在SIR模型中,我们推导出了两个关键阈值,即R0和疫苗接种阈值。这两个阈值都是属于敏感依赖于环境的临界点,环境(情境)中的微小变化都会对结果产生很大的影响。这种临界点不同于直接临界点(direct tipping point)。在直接临界点,特定时刻的微小行动会永久性地改变系统的路径。
* 而在依赖于环境的临界点上,参数的变化会改变系统的行为方式。在直接临界点上,未来的结果轨迹急转直下。
* 将倾覆与急剧上升(下降)混淆起来,导致临界点这个术语被过度滥用了。新闻媒体和互联论坛上所说那些临界点,几乎有很少符合正式定义的。
* 【模型修正】
* 在将广播模型、扩散模型和传染模型应用于社会现象时,我们可能会发现某些假设是成立的,而其他一些假设则不能成立。在这些情况下,我们可能必须对基本模型进行修正,以允许每次接触的采用概率会随着接触次数的增多而增大。这种修正,在扩大模型的应用范围时通常是必不可少的。
❷ 网络数据统计分析笔记||网络图的数学模型
前情回顾:
Gephi网络图极简教程
Network在单细胞转录组数据分析中的应用
Gephi网络图极简教程
Network在单细胞转录组数据分析中的应用
网络数据统计分析笔记|| 为什么研究网络
网络数据统计分析笔记|| 操作网络数据
网络数据统计分析笔记|| 网络数据可视化
网络数据统计分析笔记|| 网络数据的描述性分析
在前面的章节中我们了解到网络图的构建,可视化,以及网络结构的特征化描述。从本章开始,我们将进入网络图建模的主题,在网络数据分析中构建与使用模型。本章主要介绍几种常见的数学模型,就像我们在学统计建模的时候,先要学习几个常见的分布模型一样。关于统计建模的一般性描述见 环境与生态统计:R语言应用 。
所谓的网络图模型是指:
其中 是所有可能的图的集合, 是 上的一个概率分布, 是参数构成的向量,该向量的所有可能取值为 。
在随机图模型(Random graphs)中,我们模仿这样的一个环境,假如一个团体中有很多的个体,之后两个人随机的认识并且成为朋友,那么随着时间的推移,这个团体会变成什么样子呢?或者说这个以人为节点,边代表好友关系的网络会是什么样子的呢?
正式地讲,随机图模型通常是指一个给定了集合 及其上的均匀概率分布 的模型。其重要作用和完备性就像统计建模中的均匀分布一样。
比较常见的随机网路模型是Erdos-Renyi model,可以通过 sample_gnp 来构建。
查看图中组件和团的情况
可以看到我们生成的随机图不是连通的,有一个 巨型组件。
经典随机网络的性质包括:平均度与期望值比较接近,度分布均匀,节点对之间最短路径上的节点相对较少等。
广义随机图模型是经典随机图模型的一般化,具体地:
在Erdos-Renyi模型之外,最常选择的特征是固定度序列。假设对于节点数为8,一半节点的度为2,另4个节点的度为3,从满足条件的图集合中均匀抽取两个。
可见两个图并非同构。
我们可以从构建一个与已知图序列相同的图:
模拟图直径减少一半,之前的聚类也减少了。
随机图模型为我们描述了在不受任何条件控制的条件下的图,可理解为数学模型的背景模型,但是现实世界里的图往往是由特定结构的。基于机制的网络图模型 把我们带入了现实世界。其中最着名的需要所小世界模型了。
小世界模型最经典的特征是既具有规则网络的高聚集性,又具有类似随机网络的小直径。相较随机图模型,小世界模型能够更好地反映真实网络的情况。就像我们人类社会一样,人以群分,六度分隔。
例如在写本笔记的时候:
媒体经常提到COVID-19呼吸道疾病的病例和死亡人数呈“指数”增长,但这些数字暗示了其他东西,一个可能具有幂律属性的“小世界”网络。这将大大不同于疾病的指数增长路径。
在介绍随机网络时提到,随机网络无法解释真实网络中存在的一些情况:局部集聚(较高的集聚系数)和三元闭合(朋友的朋友是朋友)。从网络结构来看,随机网络与真实网络的一大差异便是过低的集聚系数,所以在随机网络模型基础上进行改进时,需要要着重考虑的便是——如何在保留小网络直径这一特点的同时提高集聚系数,使得构建的模型能够对网络局部结构进行更好的刻画。
小世界的性质:
优先连接”(preferential attachment)指的是进入一个网络的新节点倾向于与节点度高的节点相连接。反过来说,一个节点如果已经接受了很多连接,那么它就越容易被新来的节点所连接。
优先连接现象最早是在1925年,由英国统计学家George Udny Yule研究的。后来科学计量之父Derek J. de Solla Price在1976年也研究了这一现象,并把它叫做积累优势(cumulative advantage)。不过,描述优先连接最着名的模型是Albert-Laszlo Barabasi和Reka Albert提出的,所以也被叫做Barabási–Albert模型或BA模型。它的基本形式非常简明:一个新的节点i连接到网络里某个已有节点j的概率,就是节点j的度占全部已有节点的度之和的比重。
BA模型的节点度符合幂律分布,生成的是一个无标度网络(scale-free network)。
网络无标度性的形成有两个基本的要素:一是网络生长,也就是新的节点加入网络的过程;二是网络生长过程当中的优先连接。
ba网络的性质
如开头所言,随机网络作为网络的背景,它经常用来评估网络特征的显着性:即,待观测的网络与随机网络有多大程度的不一样?
假设我们有一个来自某种观测的图,此处称为 ,而我们对某些结构特征感兴趣,不妨称为 。在很多情况下,自然会考虑 是否是显着的,即在某种意义上是不寻常的和超预期的。这一过程很像我们的统计推断过程 统计推断概述 。
生成参考分布
而真实的我们数据的社团数是:
可以说是很显着的了。这时,你要问为什么?
评估小世界性的一种经典方法是:针对待观测网络以及可能观测到的/经过适当修饰的经典随机图,比较两者聚类系数和平均(最短)路径的长度。如果出现小世界性:
评估有向图的小世界性:
0.5501073 > 0.2548 ; 2.148485 > 1.858 具有一定程度的小世界性质。
https://zhuanlan.hu.com/p/146499763
https://zhuanlan.hu.com/p/205012648
https://blog.csdn.net/limiyudianzi/article/details/81632139
http://economics.mit.e/files/4623#:~:text=Generalized%20random%20graph%20models%20%28such%20as%20the%20con,combines%20high%20clustering%20with%20short%20path%20lengths%20is
https://ocw.mit.e/courses/economics/14-15j-networks-spring-2018/lecture-and-recitation-notes/MIT14_15JS18_lec12.pdf
https://zhuanlan.hu.com/p/37121528
https://www.zdnet.com/article/graph-theory-suggests-covid-19-might-be-a-small-world-after-all/
https://www.sohu.com/a/402313767_169228
❸ 如何建立一条消息在自媒体平台上传播的数学模型
快速通过新手期是可以,按以下步骤:1、每天都要发布一篇文章;2、文章必须原创,最好是高质量的,首先把态度拿出来,每篇文章1000字以上;3、图文并茂,一篇文章最少配3图以上;4、坚持一个垂直领域发文;5、起一个好点的标题,阅读量高更容易通过新手期。最后,每个月发布一点资讯推荐了的25篇文章,就可以在月初申请广告收益了。
❹ 什么是微媒体
微媒体
概述
媒体的使命是传递信息,其价值在于影响力。这种影响可以用于商业,导引某种潮流或者让市场注意某种产品;可以用于政治;也可以用于制造舆论……当媒体成为为达到某种目的而进行的传播的渠道时,这种被传递的信息就叫做广告:这是作为媒体的正当收入方式,其他都是歪门邪道——以封闭性信息来收取信息费用的小众式媒体这里姑且不论。在这种情况下媒体的差别就在于规模和受众群。
微媒体(Micro Media)是什么?在Web2.0时代,我们注意到许多人已经开始把博客叫做媒体。其实这不确切,应该是把许多个微小的博客所组成的信息传播网络看作一种媒体,并且这种媒体的规模已经到了我们不可忽视的程度;并且更重要的是,这个与所有传统媒体不同。我把这类由许多独立的发布点构成的网络传播结构,叫做微媒体(Micro Media),请注意,这个词永远指的是大量个体组成的网络结构,只理解为个体是没有意义的,并且理论上应该有一个数学模型可以计算出数量的下界。
而习惯上,我们把新浪、搜狐那些门户网站称为媒体,它们是由大型企业运营的;相对门户网站而言,个人运营的网站就是一个微媒体,其中博客便是很好的微媒体的例子,相信以后会出现更加丰富多彩的微媒体形式。
微媒体的四个特征
1、增值性
必须有信息的源头参与才可能产生有价值的微媒体网络,信息源是指任何产生信息增值的发布。写一篇文章是信息源,对信息做一次有价值的修改、或者发布一条评论,也是信息源。只要有新加入的信息即信息增值,就有可能存在感兴趣的受众,并不要求发布者有记者证,使用正式文体和写作、发布方式。
2、差异性
这种差异性是指微媒体整体与传统媒体的差异:因为都是微小的个体所发布的内容,风格、导向性、内容都会不同,很容易理解。微媒体的组成个体之间未必有很大的差异性,相反,很有可能出现大量的转载、抄袭、雷同和垃圾类信息。但是由于第4个特征的存在,这并不影响整个微媒体网络的传播效能。另外,这个差异性也有别于特立独行的“个性化”,原因很简单:就像一份小众群的杂志再精彩发行量也就那么多,我们这里只讨论大众媒体的问题。
这种差异性给了读者另一种选择,在无聊或者不想看主流媒体的时候,有了替代品。
3、传播性
这种传播指的是自发的传播而不是通过报亭这样的发布渠道,因此需要两个条件:信息源对信息公开;传递路径上没有版权障碍。有兴趣的个体自发成为传播路径上的节点,并且是以指数方式传播;再加上渠道完全免费,这两点怎能不让所有广告商疯狂!
4、选择性
由被关注到被谈论,再到被传播,这是必然的模型,信息的优胜劣汰在此自然形成。其实即使没有digg,一篇post依然会按照隐性规则进行着选择和排序,我们会把好文章告诉朋友,会发布评论,会转载……是的,我们有垃圾和spam,让某个路径上的节点非常不愉快,但是不会对网络整体产生致命影响,因为这个网络结构是自适应的。
关于功能
无外乎四种:阅读、撰写、管理、发布。由此重新组合、延伸。
服务模式
个体托管服务:集成上述四种功能,是整个微媒体网络的基础。比如博客足以胜任。
定制阅读:解决高级读者的问题,但是目前除了可以订rss还能怎么定制?甚至没法讲rss中的内容分类看。
再发布:发布到博客模版、发布成电子杂志、打印出版……如此等等。
传播渠道:RSS相关的服务,都是做渠道的,短期内尚有不错的想象,不过长期来看,个人以为应当会被某个大平台所替代。
聚合服务:将网络中的微内容组织起来在统一的地点提供阅读或其他处理。
盈利模式
开篇已经说过媒体的正道是广告,但是如果托管服务商让你用手机写并收取费用、或者出点钱给更多空间也不为过;长期的看,盈利应当来自几个方面:
广告:既然传播的是微内容、并且每一个时刻这个微内容只面对一个个体,所以很显然的,广告完全可以是针对性地——不过不知道人工智能技术是否能够支持。
信号传播费用:比如无线收入,本身信息不收费(传播收费服务的信息除外)、传播信息本身也不收费,但是传递信息的物理过程需要成本,所以收费。
增值服务费用:上述服务均需要成本,因此就有收费的可能性,当然行业内竞争过度大家为了争夺用户都免费的情况除外(这不是一个健康的行业形态)
没了?是的,没了,你希望找到一个有一万种赚钱方式和可能性的行业的话,去向上帝要。其他的歪门邪道注定不会长久,因为那背离了媒体的角色,而只有媒体的角色才是微媒体网络唯一能够长期稳定的角色。
注意到以上后两种方式也不是本质性的收入,只是因为实现上需要成本,并且是“用户可以理解和体谅的成本”,因此有收费的可能性和必要性。所以如果要作百年老店的话,还是在广告模式上创新,比如google卖关键词这种,我们需要更多此类的好主意。
法律、道德和社会方面的问题
发布者对信息负责
最近有blogger被告,问题都在如果说话了,并且伤害他人利益,如何处理的问题。在真实世界里,是必须负责的,因为有诽谤、诬蔑这些罪名;但是在微媒体中,这又有违于鼓励大家发表个人见解的精神——本来就少不了相互斗嘴的;而且如果微媒体的载体是互联网,甚至很可能没法知道到底是谁说的。
尤其是在国家间网络互通的情况下,倘若愚人节某人在blog上宣称A国对B国宣战,且此消息在多次转载和修改中已经被粉饰得相当真实,而导致B国真的向A国开展,有人需要对此负责吗?到底怎么负责?
另外关于服务提供商和信息发布者的责任划分也是一个问题,因为服务提供商很可能没有人工干预的自动传播消息,并且限于技术原因无法很好鉴别和过滤,那么他有错吗?
结语
说了这么多,其实目前来看,微媒体几乎等同于博客,因为除了博客我们没有更大规模的个体发布者网络,但是我相信很快就会有更高级、更丰富的形式出现,也许只是博客升级版。不过无论如何,未来的主流媒体当中应当有微媒体的几个席位。
❺ (数学建模)谣言的传播
假设1
第1个人还是会参加第2次的谣言传播。即第1个人和相信谣言的人会不断传播谣言
假设2
相信此谣言的人每人在单位时间内传播的平均人数正比于当时尚未听说此谣言的人数这个比恒定不变
假设3
传播的时候也会传给传播谣和听过谣言的人
设第i个单位时间开始时
相信谣言总人数
xyz(i)
没听过人数
mt(i)
受传播人数中 没听过的人数占总人数比例(共有n+1个人,出去自己就有n个人)
t(i)=mt(i)/n;
受传播人数 如果k为定植
scb(i)=k*mt(i)*xyz(i);
受传播人数中没听过谣言的人数(考虑到传播的时候也会传给传播谣和听过谣言的人)
sch_mt(i)=scb(i)*t(i);
其中相信的有
scb_mt_xx(i)=sch_mt(i)*p*a/100+sch_mt(i)*(1-p)*b/100;
其中不相信的有
scb_mt_bxx(i)=sch_mt(i)-scb_xx(i);
第i+1时刻单位时间开始时
相信谣言总人数
xyz(i+1)=xyz(i)+scb_mt_xx(i);
没听过人数
mt(i+1)=mt(i)-sch_mt(i);
受传播人数中 没听过的人数占总人数比例
t(i+1)=mt(i+1)/n;
受传播人数 如果k为定植
scb(i+1)=k*mt(i+1)*xyz(i+1);
受传播人数中没听过谣言的人数(考虑到传播的时候也会传给传播谣和听过谣言的人)
sch_mt(i+1)=scb(i+1)*t(i+1);
其中相信的有
scb_mt_xx(i+1)=sch_mt(i+1)*p*a/100+sch_mt(i+1)*(1-p)*b/100;
其中不相信的有
scb_mt_bxx(i+1)=sch_mt(i+1)-scb_xx(i+1);
可以看到各种数构成了一个循环,这样就可以无限迭代下去
根据由1单位时刻
相信谣言总人数
xyz(1)=1
没听过人数
mt(1)=n
然后迭代下去。
如果假设1中第1个人不参与,只有其他相信的人参与。
那循环应该从第三个开始(本来是第二),因为
第2时刻相信谣言总人数不是下面的公式
xyz(i+1)=xyz(i)+scb_mt_xx(i);
而是
xyz(2)=scb_mt_xx(i);
所以要从第三个循环开始
至于程序楼上都差不多搞定了。自己看着办吧。