❶ 廣播模型、擴散模型與傳染模型框架
【書籍/課程名稱】廣播模型、擴散模型與傳染模型
【類型】
[x]書籍目錄框架/課程框架
【關鍵詞】
* 廣播模型(一個信息源),擴散模型(口口相傳),SIR模型(考慮痊癒),易感者、感染者、痊癒者,巴斯模型,前提假設,概率分解,基本再生數R0, 疫苗接種閾值,群體免疫力,依賴於環境的臨界點,直接臨界點
【框架】
* 我們運用廣播模型、擴散模型和傳染模型分析信息、技術、行為、信念和傳染病在人群中的傳播。這些模型在通信科學、市場營銷學和流行病學的研究中發揮著核心作用。
* 模型將思想和傳染病傳播的微觀過程與這些採用曲線的形狀聯系起來。
* 本章中介紹的所有模型都要假設存在一個相關人群,用NPOP表示。相關人群包括那些可能患上傳染病、了解信息或採取行動的人。
* 在任何時候,總會有些人患上了某種傳染病、了解特定信息或採取了一定行動。我們將這些人稱為感染者或知情者(用It表示),相關人群中除了感染者或知情者之外的其餘成員則是易感者(用St表示)。這些易感者可能會感染傳染病、了解信息或採取行動。
* 相關人群的總人數等於感染者或知情者人數加上易感者人數的總和:NPOP=It+St。
【一、廣播模型】
* 在給定時間段內,知情者人數等於前一期的知情者人數加上易感者聽到信息的概率乘以易感者人數。由此得到的將是一個r形採用曲線。
* It+1=It+Pbroad×St
* 其中,Pbroad表示廣播概率,It和St分別等於時間t上的感染者(知情者)和易感者的數字
* 初始狀態為I0=0,且S0=NPOP。
* 廣播模型刻畫了思想、謠言、信息或技術通過電視、廣播、互聯網等媒體進行的傳播。這個模型的目標是描述一個信息源傳播信息的過程,可以是政府、企業或報紙。這個模型不適用於在人與人之間傳播的傳染病或思想。
* 在廣播模型中,相關人群中的每一個人最終都會知悉信息。如果有適當的數據,就可以估計出相關人群的規模。
【二、擴散模型】
* 【擴散模型】
* 大多數傳染病,以及關於產品、思想和技術突破的信息,都是通過口口相傳而傳播開來的,擴散模型刻畫了這些過程。擴散模型假設,當一個人採用了某種技術或患上了某種傳染病時,這個人有可能將之傳遞或傳染給與他接觸的人。
* 在這個模型中,與在傳播模型中一樣,從長期來看,相關人群中的每個人都會掌握信息。不同的是,擴散模型的採用曲線是S形的。
* 在廣播模型中,根據數據估算相關人群規模是一件相當簡單的事情。採用者的初始數量與相關人群規模密切相關。與此相反,利用擴散模型的數據估計相關群體的規模可能會非常困難。產品銷售量的增加,可能是由於一個很小的相關人群內部的高擴散概率,也可能是由於一個很大的相關人群中的低擴散概率。
* 【前提假設】
* 在傳染傳染病的情況下,個人的選擇不會在其中發揮任何作用。技術的傳播則與採用者的選擇有關,因此更有用的技術被採用的概率更高。我們並沒有在模型中明確將這種情況選擇考慮在內。
* 擴散模型假定隨機混合(random mixing)。隨機混合的含義是,相關群體中任何兩個人接觸的可能性都相同。如果將它應用於城市人口則是有問題的。在城市中,人們並不是隨機混合的。一個假設要成為有用模型的一部分,其實不一定非得十分准確不可。因此,我們將繼續使用這個假設,同時保持開放的心態,在需要改變的時候隨時改變這個假設。
* 【概率分解】
* 這種事件的發生,因環境而異。我們可以將擴散概率(diffusion probability)定義為接觸概率(contact probability)和分享概率(sharing probability)的乘積。我們可以根據擴散概率來構建模型,但是在估計或應用模型時,必須獨立地跟蹤接觸概率和分享概率。
* 應用軟體擴散:要想改變第一個概率是很困難的。為了增大第二個概率,開發人員可以為帶來了新注冊用戶的老用戶提供一些激勵,雖然這樣做能夠增加擴散速度,但是並不會影響總銷量,至少根據這個模型來看不會有影響。如上所述,總銷量等於相關人群的規模,而與分享概率高低無關,提高銷售速度不會帶來長期的影響。
* 【巴斯模型】
* 大多數消費品和信息都是通過廣播和擴散傳播的。而巴斯模型則將這兩個過程組合在一起了。巴斯模型中的差分方程等於廣播模型和擴散模型中的差分方程之和。在巴斯模型中,擴散概率越大,採用曲線的S形就越顯著。
【三、傳染SIR模型】
* 【SIR模型】
* 在我們已經討論過的模型中,一旦有人採用了一項技術,則永遠不會放棄它。但這並不適用於所有通過擴散傳播的事物,例如我們患上了某種傳染病之後不久就會恢復健康,或者當我們採用了某種流行款式或參加了某項潮流運動之後,是可以放棄的。
* 我們將放棄所採用的某種事物的人稱為痊癒者。由此產生的模型,即SIR模型(易感者、感染者、痊癒者),在流行病學中占據了中心位置。
* 為了避免過於復雜的數學計算,我們假設治癒傳染病的人會重新進入易感人群,也就是說治癒傳染病並不會產生未來對傳染病的免疫力。
* 【基本再生數R0】
* 某種傳染病,如果R0大於1,那麼這種傳染病就可以傳遍整個人群,而R0小於1的傳染病則趨於消失。
* 必須接種疫苗的人的比例,即疫苗接種閾值(vaccination threshold),可以通過公式Vt≥(R0-1)/R0求出。我們可以從上述模型中推導出這個公式。對於麻疹和脊髓灰質炎等R0非常高的傳染病,政府將努力保證所有人都接種疫苗。
* 有些人擔心疫苗有副作用,選擇不參加疫苗接種計劃。如果這些人只佔人口的一小部分,那麼其他人接種疫苗也可以防止這些人感染這種傳染病,流行病學家將這種現象稱為群體免疫力。選擇不接種疫苗的人事實上是搭了其他接種疫苗的人的便車。
* 【超級傳播者】
* 如果將SIR模型嵌入到網路中,就會觀察到度分布對傳染病傳播的重要性。
* 對於中心輻射型網路,R0攜帶的信息量很有限,因為如果中心節點患上了傳染病,傳染病就會傳播開來。流行病學家們將位置在度很高的中心節點上的人稱為「超級傳播者」(superspreaders)。高度數節點不但能夠更快地傳播傳染病,而且會更快地患上傳染病。節點對傳染病(或思想)傳播的貢獻與節點的度的平方相關。
* 【成功與臨界點】
* 盡管SIR模型原本是用來分析傳染病傳播的,但是我們也可以將它應用於所有先通過擴散傳播,然後趨於消失的社會現象,例如書的銷售、歌曲的流行、舞步的風行,「熱詞」的傳播、食譜和健身方法的流傳等。
* 在這些情形下,我們也可以估計接觸概率、傳播概率和「痊癒」概率,以及基本再生數R0。這個模型意味著,這些概率只要發生了微小的變化,就可以使R0移動到高於零的水平,從而造成成功與失敗之間的天壤之別。
* 成功可能取決於非常微小的差異,一件事情做得很好與搞砸了之間,只有極其細微的差異。
* 在SIR模型中,我們推導出了兩個關鍵閾值,即R0和疫苗接種閾值。這兩個閾值都是屬於敏感依賴於環境的臨界點,環境(情境)中的微小變化都會對結果產生很大的影響。這種臨界點不同於直接臨界點(direct tipping point)。在直接臨界點,特定時刻的微小行動會永久性地改變系統的路徑。
* 而在依賴於環境的臨界點上,參數的變化會改變系統的行為方式。在直接臨界點上,未來的結果軌跡急轉直下。
* 將傾覆與急劇上升(下降)混淆起來,導致臨界點這個術語被過度濫用了。新聞媒體和互聯論壇上所說那些臨界點,幾乎有很少符合正式定義的。
* 【模型修正】
* 在將廣播模型、擴散模型和傳染模型應用於社會現象時,我們可能會發現某些假設是成立的,而其他一些假設則不能成立。在這些情況下,我們可能必須對基本模型進行修正,以允許每次接觸的採用概率會隨著接觸次數的增多而增大。這種修正,在擴大模型的應用范圍時通常是必不可少的。
❷ 網路數據統計分析筆記||網路圖的數學模型
前情回顧:
Gephi網路圖極簡教程
Network在單細胞轉錄組數據分析中的應用
Gephi網路圖極簡教程
Network在單細胞轉錄組數據分析中的應用
網路數據統計分析筆記|| 為什麼研究網路
網路數據統計分析筆記|| 操作網路數據
網路數據統計分析筆記|| 網路數據可視化
網路數據統計分析筆記|| 網路數據的描述性分析
在前面的章節中我們了解到網路圖的構建,可視化,以及網路結構的特徵化描述。從本章開始,我們將進入網路圖建模的主題,在網路數據分析中構建與使用模型。本章主要介紹幾種常見的數學模型,就像我們在學統計建模的時候,先要學習幾個常見的分布模型一樣。關於統計建模的一般性描述見 環境與生態統計:R語言應用 。
所謂的網路圖模型是指:
其中 是所有可能的圖的集合, 是 上的一個概率分布, 是參數構成的向量,該向量的所有可能取值為 。
在隨機圖模型(Random graphs)中,我們模仿這樣的一個環境,假如一個團體中有很多的個體,之後兩個人隨機的認識並且成為朋友,那麼隨著時間的推移,這個團體會變成什麼樣子呢?或者說這個以人為節點,邊代表好友關系的網路會是什麼樣子的呢?
正式地講,隨機圖模型通常是指一個給定了集合 及其上的均勻概率分布 的模型。其重要作用和完備性就像統計建模中的均勻分布一樣。
比較常見的隨機網路模型是Erdos-Renyi model,可以通過 sample_gnp 來構建。
查看圖中組件和團的情況
可以看到我們生成的隨機圖不是連通的,有一個 巨型組件。
經典隨機網路的性質包括:平均度與期望值比較接近,度分布均勻,節點對之間最短路徑上的節點相對較少等。
廣義隨機圖模型是經典隨機圖模型的一般化,具體地:
在Erdos-Renyi模型之外,最常選擇的特徵是固定度序列。假設對於節點數為8,一半節點的度為2,另4個節點的度為3,從滿足條件的圖集合中均勻抽取兩個。
可見兩個圖並非同構。
我們可以從構建一個與已知圖序列相同的圖:
模擬圖直徑減少一半,之前的聚類也減少了。
隨機圖模型為我們描述了在不受任何條件控制的條件下的圖,可理解為數學模型的背景模型,但是現實世界裡的圖往往是由特定結構的。基於機制的網路圖模型 把我們帶入了現實世界。其中最著名的需要所小世界模型了。
小世界模型最經典的特徵是既具有規則網路的高聚集性,又具有類似隨機網路的小直徑。相較隨機圖模型,小世界模型能夠更好地反映真實網路的情況。就像我們人類社會一樣,人以群分,六度分隔。
例如在寫本筆記的時候:
媒體經常提到COVID-19呼吸道疾病的病例和死亡人數呈「指數」增長,但這些數字暗示了其他東西,一個可能具有冪律屬性的「小世界」網路。這將大大不同於疾病的指數增長路徑。
在介紹隨機網路時提到,隨機網路無法解釋真實網路中存在的一些情況:局部集聚(較高的集聚系數)和三元閉合(朋友的朋友是朋友)。從網路結構來看,隨機網路與真實網路的一大差異便是過低的集聚系數,所以在隨機網路模型基礎上進行改進時,需要要著重考慮的便是——如何在保留小網路直徑這一特點的同時提高集聚系數,使得構建的模型能夠對網路局部結構進行更好的刻畫。
小世界的性質:
優先連接」(preferential attachment)指的是進入一個網路的新節點傾向於與節點度高的節點相連接。反過來說,一個節點如果已經接受了很多連接,那麼它就越容易被新來的節點所連接。
優先連接現象最早是在1925年,由英國統計學家George Udny Yule研究的。後來科學計量之父Derek J. de Solla Price在1976年也研究了這一現象,並把它叫做積累優勢(cumulative advantage)。不過,描述優先連接最著名的模型是Albert-Laszlo Barabasi和Reka Albert提出的,所以也被叫做Barabási–Albert模型或BA模型。它的基本形式非常簡明:一個新的節點i連接到網路里某個已有節點j的概率,就是節點j的度佔全部已有節點的度之和的比重。
BA模型的節點度符合冪律分布,生成的是一個無標度網路(scale-free network)。
網路無標度性的形成有兩個基本的要素:一是網路生長,也就是新的節點加入網路的過程;二是網路生長過程當中的優先連接。
ba網路的性質
如開頭所言,隨機網路作為網路的背景,它經常用來評估網路特徵的顯著性:即,待觀測的網路與隨機網路有多大程度的不一樣?
假設我們有一個來自某種觀測的圖,此處稱為 ,而我們對某些結構特徵感興趣,不妨稱為 。在很多情況下,自然會考慮 是否是顯著的,即在某種意義上是不尋常的和超預期的。這一過程很像我們的統計推斷過程 統計推斷概述 。
生成參考分布
而真實的我們數據的社團數是:
可以說是很顯著的了。這時,你要問為什麼?
評估小世界性的一種經典方法是:針對待觀測網路以及可能觀測到的/經過適當修飾的經典隨機圖,比較兩者聚類系數和平均(最短)路徑的長度。如果出現小世界性:
評估有向圖的小世界性:
0.5501073 > 0.2548 ; 2.148485 > 1.858 具有一定程度的小世界性質。
https://zhuanlan.hu.com/p/146499763
https://zhuanlan.hu.com/p/205012648
https://blog.csdn.net/limiyudianzi/article/details/81632139
http://economics.mit.e/files/4623#:~:text=Generalized%20random%20graph%20models%20%28such%20as%20the%20con,combines%20high%20clustering%20with%20short%20path%20lengths%20is
https://ocw.mit.e/courses/economics/14-15j-networks-spring-2018/lecture-and-recitation-notes/MIT14_15JS18_lec12.pdf
https://zhuanlan.hu.com/p/37121528
https://www.zdnet.com/article/graph-theory-suggests-covid-19-might-be-a-small-world-after-all/
https://www.sohu.com/a/402313767_169228
❸ 如何建立一條消息在自媒體平台上傳播的數學模型
快速通過新手期是可以,按以下步驟:1、每天都要發布一篇文章;2、文章必須原創,最好是高質量的,首先把態度拿出來,每篇文章1000字以上;3、圖文並茂,一篇文章最少配3圖以上;4、堅持一個垂直領域發文;5、起一個好點的標題,閱讀量高更容易通過新手期。最後,每個月發布一點資訊推薦了的25篇文章,就可以在月初申請廣告收益了。
❹ 什麼是微媒體
微媒體
概述
媒體的使命是傳遞信息,其價值在於影響力。這種影響可以用於商業,導引某種潮流或者讓市場注意某種產品;可以用於政治;也可以用於製造輿論……當媒體成為為達到某種目的而進行的傳播的渠道時,這種被傳遞的信息就叫做廣告:這是作為媒體的正當收入方式,其他都是歪門邪道——以封閉性信息來收取信息費用的小眾式媒體這里姑且不論。在這種情況下媒體的差別就在於規模和受眾群。
微媒體(Micro Media)是什麼?在Web2.0時代,我們注意到許多人已經開始把博客叫做媒體。其實這不確切,應該是把許多個微小的博客所組成的信息傳播網路看作一種媒體,並且這種媒體的規模已經到了我們不可忽視的程度;並且更重要的是,這個與所有傳統媒體不同。我把這類由許多獨立的發布點構成的網路傳播結構,叫做微媒體(Micro Media),請注意,這個詞永遠指的是大量個體組成的網路結構,只理解為個體是沒有意義的,並且理論上應該有一個數學模型可以計算出數量的下界。
而習慣上,我們把新浪、搜狐那些門戶網站稱為媒體,它們是由大型企業運營的;相對門戶網站而言,個人運營的網站就是一個微媒體,其中博客便是很好的微媒體的例子,相信以後會出現更加豐富多彩的微媒體形式。
微媒體的四個特徵
1、增值性
必須有信息的源頭參與才可能產生有價值的微媒體網路,信息源是指任何產生信息增值的發布。寫一篇文章是信息源,對信息做一次有價值的修改、或者發布一條評論,也是信息源。只要有新加入的信息即信息增值,就有可能存在感興趣的受眾,並不要求發布者有記者證,使用正式文體和寫作、發布方式。
2、差異性
這種差異性是指微媒體整體與傳統媒體的差異:因為都是微小的個體所發布的內容,風格、導向性、內容都會不同,很容易理解。微媒體的組成個體之間未必有很大的差異性,相反,很有可能出現大量的轉載、抄襲、雷同和垃圾類信息。但是由於第4個特徵的存在,這並不影響整個微媒體網路的傳播效能。另外,這個差異性也有別於特立獨行的「個性化」,原因很簡單:就像一份小眾群的雜志再精彩發行量也就那麼多,我們這里只討論大眾媒體的問題。
這種差異性給了讀者另一種選擇,在無聊或者不想看主流媒體的時候,有了替代品。
3、傳播性
這種傳播指的是自發的傳播而不是通過報亭這樣的發布渠道,因此需要兩個條件:信息源對信息公開;傳遞路徑上沒有版權障礙。有興趣的個體自發成為傳播路徑上的節點,並且是以指數方式傳播;再加上渠道完全免費,這兩點怎能不讓所有廣告商瘋狂!
4、選擇性
由被關注到被談論,再到被傳播,這是必然的模型,信息的優勝劣汰在此自然形成。其實即使沒有digg,一篇post依然會按照隱性規則進行著選擇和排序,我們會把好文章告訴朋友,會發布評論,會轉載……是的,我們有垃圾和spam,讓某個路徑上的節點非常不愉快,但是不會對網路整體產生致命影響,因為這個網路結構是自適應的。
關於功能
無外乎四種:閱讀、撰寫、管理、發布。由此重新組合、延伸。
服務模式
個體託管服務:集成上述四種功能,是整個微媒體網路的基礎。比如博客足以勝任。
定製閱讀:解決高級讀者的問題,但是目前除了可以訂rss還能怎麼定製?甚至沒法講rss中的內容分類看。
再發布:發布到博客模版、發布成電子雜志、列印出版……如此等等。
傳播渠道:RSS相關的服務,都是做渠道的,短期內尚有不錯的想像,不過長期來看,個人以為應當會被某個大平台所替代。
聚合服務:將網路中的微內容組織起來在統一的地點提供閱讀或其他處理。
盈利模式
開篇已經說過媒體的正道是廣告,但是如果託管服務商讓你用手機寫並收取費用、或者出點錢給更多空間也不為過;長期的看,盈利應當來自幾個方面:
廣告:既然傳播的是微內容、並且每一個時刻這個微內容只面對一個個體,所以很顯然的,廣告完全可以是針對性地——不過不知道人工智慧技術是否能夠支持。
信號傳播費用:比如無線收入,本身信息不收費(傳播收費服務的信息除外)、傳播信息本身也不收費,但是傳遞信息的物理過程需要成本,所以收費。
增值服務費用:上述服務均需要成本,因此就有收費的可能性,當然行業內競爭過度大家為了爭奪用戶都免費的情況除外(這不是一個健康的行業形態)
沒了?是的,沒了,你希望找到一個有一萬種賺錢方式和可能性的行業的話,去向上帝要。其他的歪門邪道註定不會長久,因為那背離了媒體的角色,而只有媒體的角色才是微媒體網路唯一能夠長期穩定的角色。
注意到以上後兩種方式也不是本質性的收入,只是因為實現上需要成本,並且是「用戶可以理解和體諒的成本」,因此有收費的可能性和必要性。所以如果要作百年老店的話,還是在廣告模式上創新,比如google賣關鍵詞這種,我們需要更多此類的好主意。
法律、道德和社會方面的問題
發布者對信息負責
最近有blogger被告,問題都在如果說話了,並且傷害他人利益,如何處理的問題。在真實世界裡,是必須負責的,因為有誹謗、誣蔑這些罪名;但是在微媒體中,這又有違於鼓勵大家發表個人見解的精神——本來就少不了相互鬥嘴的;而且如果微媒體的載體是互聯網,甚至很可能沒法知道到底是誰說的。
尤其是在國家間網路互通的情況下,倘若愚人節某人在blog上宣稱A國對B國宣戰,且此消息在多次轉載和修改中已經被粉飾得相當真實,而導致B國真的向A國開展,有人需要對此負責嗎?到底怎麼負責?
另外關於服務提供商和信息發布者的責任劃分也是一個問題,因為服務提供商很可能沒有人工干預的自動傳播消息,並且限於技術原因無法很好鑒別和過濾,那麼他有錯嗎?
結語
說了這么多,其實目前來看,微媒體幾乎等同於博客,因為除了博客我們沒有更大規模的個體發布者網路,但是我相信很快就會有更高級、更豐富的形式出現,也許只是博客升級版。不過無論如何,未來的主流媒體當中應當有微媒體的幾個席位。
❺ (數學建模)謠言的傳播
假設1
第1個人還是會參加第2次的謠言傳播。即第1個人和相信謠言的人會不斷傳播謠言
假設2
相信此謠言的人每人在單位時間內傳播的平均人數正比於當時尚未聽說此謠言的人數這個比恆定不變
假設3
傳播的時候也會傳給傳播謠和聽過謠言的人
設第i個單位時間開始時
相信謠言總人數
xyz(i)
沒聽過人數
mt(i)
受傳播人數中 沒聽過的人數占總人數比例(共有n+1個人,出去自己就有n個人)
t(i)=mt(i)/n;
受傳播人數 如果k為定植
scb(i)=k*mt(i)*xyz(i);
受傳播人數中沒聽過謠言的人數(考慮到傳播的時候也會傳給傳播謠和聽過謠言的人)
sch_mt(i)=scb(i)*t(i);
其中相信的有
scb_mt_xx(i)=sch_mt(i)*p*a/100+sch_mt(i)*(1-p)*b/100;
其中不相信的有
scb_mt_bxx(i)=sch_mt(i)-scb_xx(i);
第i+1時刻單位時間開始時
相信謠言總人數
xyz(i+1)=xyz(i)+scb_mt_xx(i);
沒聽過人數
mt(i+1)=mt(i)-sch_mt(i);
受傳播人數中 沒聽過的人數占總人數比例
t(i+1)=mt(i+1)/n;
受傳播人數 如果k為定植
scb(i+1)=k*mt(i+1)*xyz(i+1);
受傳播人數中沒聽過謠言的人數(考慮到傳播的時候也會傳給傳播謠和聽過謠言的人)
sch_mt(i+1)=scb(i+1)*t(i+1);
其中相信的有
scb_mt_xx(i+1)=sch_mt(i+1)*p*a/100+sch_mt(i+1)*(1-p)*b/100;
其中不相信的有
scb_mt_bxx(i+1)=sch_mt(i+1)-scb_xx(i+1);
可以看到各種數構成了一個循環,這樣就可以無限迭代下去
根據由1單位時刻
相信謠言總人數
xyz(1)=1
沒聽過人數
mt(1)=n
然後迭代下去。
如果假設1中第1個人不參與,只有其他相信的人參與。
那循環應該從第三個開始(本來是第二),因為
第2時刻相信謠言總人數不是下面的公式
xyz(i+1)=xyz(i)+scb_mt_xx(i);
而是
xyz(2)=scb_mt_xx(i);
所以要從第三個循環開始
至於程序樓上都差不多搞定了。自己看著辦吧。