
大數據算得出曹雪芹的生卒年嗎
2015年被不少學者認為是曹雪芹誕生300周年。不過,關于曹雪芹的出生年份,學界一直有不同的看法:除了1715年之外,還有一種觀點認為是在1724年,雙方都很難說服對方。最近,臺灣學者黃一農通過大數據搜索獲得的結果,為揭開此謎底又前進了一步。
大數據能否幫我們找到曹雪芹的人生軌跡?上海師范大學教授、中國紅樓夢學會副會長孫遜就此認為,很難期待大數據為紅學研究帶來重大突破,但大數據確實可以幫助我們解決《紅樓夢》和曹雪芹研究中的一些具體問題;不僅如此,這一新興的技術手段對于古典文學研究也具有一定的普遍意義。
“四十年華”,究竟是四十歲還是四十八九歲
曹雪芹去世后,他的至交敦誠寫下了《挽曹雪芹(甲申)》一詩:“四十年華付杳冥,哀旌一片阿誰銘?”同是曹雪芹好友的張宜泉也寫過一首《傷芹溪居士》,題注中稱“其人素性放達,好飲,又善書畫,年未五旬而卒”。
因為以上兩則資料,引發了后世關于曹雪芹生卒年的長期爭議。包括周汝昌在內的一批學者根據“四十年華”,認定曹雪芹只活了40歲,并由此推斷出他生于1724年。另有研究者認為,如果這一論斷成立,曹府被抄家時曹雪芹只有3歲,不應該有他在《紅樓夢》中所表現出來的對于繁華生活的深刻記憶;相比之下,如果依據“年未五旬而卒”,即活了四十八九歲來推算,他應生于1715年,曹家被抄時他已經12歲。這就比較符合“秦淮舊夢憶繁華”的年齡,而且和該年曹頫的奏折中提到的曹颙的遺腹子相吻合。但這樣的話,“四十年華”又如何解釋?
最近,大數據為解決這一難題提供了突破口。孫遜教授介紹,不久前在北京張家灣舉辦的紅學會上,臺灣地區計算機專家、倡導e考據的黃一農先生利用大數據,以“四十年華”“五十年華”“六十年華”為關鍵詞,搜尋了包括董邦達在內的曹雪芹同時代人的詩作,結果發現,以“四十年華”來表示四十八九歲,“五十年華”表示五十八九歲,“六十年華”表示六十八九歲,是那個時代通行的用法。這樣,“四十年華付杳冥”與“年未五旬而卒”,就變得不僅不矛盾,而且完全合榫。
曹雪芹的朋友圈,或為紅學研究提供新發現
孫遜認為,目前,關于曹雪芹和《紅樓夢》的直接資料中再出現突破性的新發現比較困難,但是大數據可以為一些至今懸而未決的問題提供旁證。所謂懸而未決的問題,包括曹雪芹的人生蹤跡以及《紅樓夢》的成書年代等,這些都可能對后世了解其生平與創作有著重要作用。
比如學界普遍認為,紅學研究要有新發現,從曹雪芹的朋友圈入手或許是一條重要的路徑。曹雪芹本人多才多藝,因此朋友圈人數眾多,范圍很廣,細算下來有數十人之多,包括詩人、書畫家、王公貴族和漢滿官員,他們或多或少留下了一些和曹雪芹相關的作品,提供了與他相關的一鱗半爪的信息。如果將其龐大的朋友圈的作品數字化,說不定可以從中發現更多像“四十年華”一類有價值的信息。
整個古典文學研究,也許都將受惠于大數據
實際上,大數據對于古典文學研究的意義不止于紅學。以清光緒年間上海的一位民間才子郭友松為例,他用松江方言寫成的《玄空經》,是繼清乾隆、嘉慶年間,上海才子張南莊創作的《何典》之后又一部杰出的吳語諷刺小說。然而長期以來,關于郭友松的一些資料多為民間口口相傳的逸聞軼事,缺少可靠依據,因此學界對他研究甚少。較早對其進行關注的葉德均和白蕉,都因為資料所限,在包括其生卒年在內的一些基本問題上無法作出確切考證。
近年來,隨著相關材料不斷被數字化,一些線索開始浮出水面。比如孫遜和他的團隊一起,通過晚清民國報刊數據庫,查找出了1887年《申報》上刊登的幾首賀郭友松70大壽的詩詞,以及他在墨海書館《益聞錄》上發表的數十篇雜論,再加上已出版的紙質文本《張文虎日記》《王韜日記》中對他的人生蹤跡的記載。此外,??睂W家、小說評點家張文虎、江蘇學使李小湖、畫家張鳴珂等人的文集,由此大致勾勒出郭友松的人生軌跡和著述情況。如果沒有大數據,恐怕一時很難發現他散落在報刊上的著述與生日信息;但如果不仔細找尋和細讀那些還沒有電子化的古籍文獻,研究也不可能深入。
在孫遜看來,大數據未必能夠解決古典文學研究中的所有問題,特別是一些重大問題,但它可以提供一些資料和線索;如果運用得當,并和直接查找紙質文獻結合起來,就可以使相關研究如虎添翼。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25