
大數據量并發處理
大并發大數據量請求的處理方法
大并發大數據量請求一般會分為幾種情況:
1.大量的用戶同時對系統的不同功能頁面進行查找,更新操作
2.大量的用戶同時對系統的同一個頁面,同一個表的大數據量進行查詢操作
3.大量的用戶同時對系統的同一個頁面,同一個表進行更新操作
對于第一種情況一般處理方法如下:
一。對服務器層面的處理
1. 調整IIS 7應用程序池隊列長度
由原來的默認1000改為65535。
IIS Manager > ApplicationPools > Advanced Settings
Queue Length : 65535
2. 調整IIS 7的appConcurrentRequestLimit設置
由原來的默認5000改為100000。
c:\windows\system32\inetsrv\appcmd.exe set config /section:serverRuntime /appConcurrentRequestLimit:100000
在%systemroot%\System32\inetsrv\config\applicationHost.config中可以查看到該設置:
[html] view plaincopy
<serverRuntime appConcurrentRequestLimit="100000" />
[html] view plain copy
<serverRuntime appConcurrentRequestLimit="100000" />
3. 調整machine.config中的processModel>requestQueueLimit的設置
由原來的默認5000改為100000。
[html] view plaincopy
<configuration>
<system.web>
<processModel requestQueueLimit="100000"/>
[html] view plain copy
<configuration>
<system.web>
<processModel requestQueueLimit="100000"/>
4. 修改注冊表,調整IIS 7支持的同時TCPIP連接數
由原來的默認5000改為100000。
reg add HKLM\System\CurrentControlSet\Services\HTTP\Parameteris /v MaxConnections /t REG_DWORD /d 100000
完成上述4個設置,就基本可以支持10萬個同時請求。如果訪問量達到10萬以上,就可以考慮將程序和數據庫按功能模塊劃分部署到多個服務器分擔訪問壓力。另外可以考慮軟硬件負載均衡。硬件負載均衡能夠直接通過智能交換機實現,處理能力強,而且與系統無關,但是價格貴,配置困難,不能區分實習系統與應狀態。所以硬件負載均衡適用于一大堆設備,大訪問量,簡單應用。軟件負載均衡是基于系統與應用的,能過更好地根據系統與應用的狀況來分配負載。性價比高。PCL負載均衡軟件,Linux下的LVS軟件。
二。對數據庫層面的處理
當兩個用戶同時訪問一個頁面,一個用戶可能更新的是另一個用戶已經刪除的記錄?;蛘?,在一個用戶加載頁面跟他點擊刪除按鈕之間的時間里,另一個用戶修改了這條記錄的內容。所以需要考慮數據庫鎖的問題
有下面三中并發控制策略可供選擇:
什么都不做 –如果并發用戶修改的是同一條記錄,讓最后提交的結果生效(默認的行為)
開放式并發(Optimistic Concurrency) - 假定并發沖突只是偶爾發生,絕大多數的時候并不會出現; 那么,當發生一個沖突時,僅僅簡單的告知用戶,他所作的更改不能保存,因為別的用戶已經修改了同一條記錄
保守式并發(Pessimistic Concurrency) – 假定并發沖突經常發生,并且用戶不能容忍被告知自己的修改不能保存是由于別人的并發行為;那么,當一個用戶開始編輯一條記錄,鎖定該記錄,從而防止其他用戶編輯或刪除該記錄,直到他完成并提交自己的更改
當多個用戶試圖同時修改數據時,需要建立控制機制來防止一個用戶的修改對同時操作的其他用戶所作的修改產生不利的影響。處理這種情況的系統叫做“并發控制”。
并發控制的類型
通常,管理數據庫中的并發有三種常見的方法:
保守式并發控制 - 在從獲取記錄直到記錄在數據庫中更新的這段時間內,該行對用戶不可用。
開放式并發控制 - 只有當實際更新數據時,該行才對其他用戶不可用。更新將在數據庫中檢查該行并確定是否進行了任何更改。如果試圖更新已更改的記錄,則將導致并發沖突。
最后的更新生效 - 只有當實際更新數據時,該行才對其他用戶不可用。但是,不會將更新與初始記錄進行比較;而只是寫出記錄,這可能就改寫了自上次刷新記錄后其他用戶所進行的更改。
保守式并發
保守式并發通常用于兩個目的。第一,在某些情況下,存在對相同記錄的大量爭用。在數據上放置鎖所費的成本小于發生并發沖突時回滾更改所費的成本。
在事務過程中不宜更改記錄的情況下,保守式并發也非常有用。庫存應用程序便是一個很好的示例。假定有一個公司代表正在為一名潛在的客戶檢查庫存。您通常要鎖定記錄,直到生成訂單為止,這通常會將該項標記為“已訂購”狀態并將其從可用庫存中移除。如果未生成訂單,則將釋放該鎖,以便其他檢查庫存的用戶得到準確的可用庫存計數。
但是,在斷開的結構中無法進行保守式并發控制。連接打開的時間只夠讀取數據或更新數據,因此不能長時間地保持鎖。此外,長時間保留鎖的應用程序將無法進行伸縮。
開放式并發
在開放式并發中,只有在訪問數據庫時才設置并保持鎖。這些鎖將防止其他用戶在同一時間更新記錄。除了進行更新這一確切的時刻之外,數據始終可用。有關更多信息,請參見開放式并發。
當試圖更新時,已更改行的初始版本將與數據庫中的現有行進行比較。如果兩者不同,更新將失敗,并引發并發錯誤。這時,將由您使用所創建的業務邏輯來協調這兩行。
最后的更新生效
當使用“最后的更新生效”時,不會對初始數據進行檢查,而只是將更新寫入數據庫。很明顯,可能會發生以下情況:
用戶 A 從數據庫獲取一項記錄。
用戶 B 從數據庫獲取相同的記錄,對其進行修改,然后將更新后的記錄寫回數據庫。
用戶 A 修改“舊”記錄并將其寫回數據庫。
在上述情況中,用戶 A 永遠也不會看到用戶 B 作出的更改。如果您計劃使用并發控制的“最后的更新生效”方法,則要確保這種情況是可以接受的。
ADO.NET 和 Visual Studio .NET 中的并發控制
因為數據結構基于斷開的數據,所以 ADO.NET 和 Visual Studio .NET 使用開放式并發。因此,您需要添加業務邏輯,以利用開放式并發解決問題。
如果您選擇使用開放式并發,則可以通過兩種常規的方法來確定是否已發生更改:版本方法(實際版本號或日期時間戳)和保存所有值方法。
版本號方法
在版本號方法中,要更新的記錄必須具有一個包含日期時間戳或版本號的列。當讀取該記錄時,日期時間戳或版本號將保存在客戶端。然后,將對該值進行部分更新。
處理并發的一種方法是僅當 WHERE 子句中的值與記錄上的值匹配時才進行更新。該方法的 SQL 表示形式為:
UPDATE Table1 SET Column1 = @newvalue1, Column2 = @newvalue2
WHERE DateTimeStamp = @origDateTimeStamp
或者,可以使用版本號進行比較:
UPDATE Table1 SET Column1 = @newvalue1, Column2 = @newvalue2
WHERE RowVersion = @origRowVersionValue
如果日期時間戳或版本號匹配,則表明數據存儲區中的記錄未被更改,并且可以安全地使用數據集中的新值對該記錄進行更新。如果不匹配,則將返回錯誤。您可以編寫代碼,在 Visual Studio .NET 中實現這種形式的并發檢查。您還必須編寫代碼來響應任何更新沖突。為了確保日期時間戳或版本號的準確性,您需要在表上設置觸發器,以便在發生對行的更改時,對日期時間戳或版本號進行更新。
保存所有值方法
使用日期時間戳或版本號的替代方法是在讀取記錄時獲取所有字段的副本。ADO.NET 中的 DataSet 對象維護每個修改記錄的兩個版本:初始版本(最初從數據源中讀取的版本)和修改版本(表示用戶更新)。當試圖將記錄寫回數據源時,數據行中的初始值將與數據源中的記錄進行比較。如果它們匹配,則表明數據庫記錄在被讀取后尚未經過更改。在這種情況下,數據集中已更改的值將成功地寫入數據庫。
對于數據適配器的四個命令(DELETE、INSERT、SELECT 和 UPDATE)來說,每個命令都有一個參數集合。每個命令都有用于初始值和當前值(或修改值)的參數。
對于第二種情況的處理:
因為是大并發請求,也能采用第一種情況的處理方法,另外因為是對大數據量進行檢索,所以需要考慮查詢效率的問題
1.對表按查詢條件建立索引
2.對查詢語句進行優化
3.可以考慮對查詢數據使用緩存
對于第三種情況的處理:
也能采用第一種情況的處理方法,另外因為是對同一個表進行更新操作,可以考慮使用下面的處理方法:
1.先將數據保存到緩存中,當數據達到一定的數量后,再更新到數據庫中
2.將表按索引劃分(分表,分區),如:對于一個存儲全國人民信息的表,這個數據量是很大的,如果按省劃分為多個表,在將全國的人民信息按省存儲到相應的表中,然后根據省份對相應的并進行查詢和更新,這樣大并發和大數據量的問題就會減小很多
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25