如何評價2018年美國數學建模競賽C題?
2018年美賽問題C的題目
把c題數據做了回歸預測,看了看誤差,我tm一口老血,有些指標都跑到負的去了。
美國這破經濟,每幾年一次經濟危機,各項數據都是斷崖式下跌,畫出的曲線都快成魏爾斯特拉斯函數了,讓我拿頭預測啊看看我國,經濟逐年穩步上漲,畫出來的曲線多光滑,回歸也好做啊
別跟我扯什麼資本主義根本矛盾,趕快給我皈依社會主義————————更新一波————————————
吐嘈歸吐嘈,回歸還是要做的,經過我的一系列魯棒優化(cuan gai shu ju)已經可以精準預測(xjb cai)了寫文的和建模的已經忙的頭都爛了,本程序猿填填補補第一天寫的程序已經勉強能預測2025年的gdp了(真要是猜中了,諾貝爾經濟學獎提名請記得我)
祝各位知乎er美模取得好成績吧—————摸魚美模程序猿又來更新知乎了——
我們隊終於幫老美製定好了十二五規劃!只要按我們的計划走,到本世紀中葉一定能成為中等發達的社會主,不,資本主義國家年紀輕輕的中國本科大學生告訴美國四個州的州長怎樣實現可持續發展的悲傷故事
---@更新於2018/2/10
此時此刻的心態
希望同學們自己能夠有所創新,不要被參考資料所束縛,而且也不要過於依賴別人的思路,相信自己的idea!而且這個僅供參考,靈感最重要大哥大姐們。私信我沒法一個個去回,真的…太多了…而且…我也要比賽…請你們諒解
C題找到突破口其實是很簡單的題目,我簡單的分析一下吧。
關鍵點:600多個指標???10萬多條數據???一臉蒙圈吧。
相信很多擅長靠「神經網路推導湊論文大法」、「各種灰色預測」等高大上的模型的戰友們一看的C題彷彿到了高潮。
可是到你打開數據的那一刻,是不是蒙圈了。全英文+10萬多的數據+600指標。那麼如何進行可視化處理呢?600多個變數坐標軸也放不開呀。
核心關鍵點:去除冗餘數據
我經過去除冗餘數據之後,只剩下二十幾個指標,當然是多個角度20幾個指標,每個角度的指標控制在5個左右,比如不同部門(交通、住房、商業、電力、工業)部門的總能源消耗量,這就是一個角度呀。層層剝離,問題迎刃而解...
隊友喊我去跑代碼了...逃...有空(看你們心意)再來更...
周五下午6:28更新
數據指標處理好了圖可勁造…後來…我竟然做出來了一張這種圖…
公眾號:有一件事我替你講 在公眾號後台回復 美賽,即可得到我從某團隊得到的問題思路。
各位加油!
可以參考這一篇學術論文:
能源發展趨勢及主要節能措施?xueshu.baidu.com@article{1989Trends,
title={Trends in the Development of Energy Resources and Major Approaches to Their Economization},
journal={Journal of Shanghai Jiaotong University},
year={1989},
}
~o( =∩ω∩= )m
先吐槽:
1.本著不干涉他國內政原則,我選擇放棄
2.現在放棄,寒假就開始了
3.第一天建模,
第二天編數據,
第三天連數據都不會編,
第四天,我是誰?我在哪?我在做什麼?
4.評委噁心了我們四天,我把論文給他看,也噁心噁心評委
——————————————————————假裝是分割線
回到正題,C題有三個部分
在Part Ⅰ中,
A題我們篩選數據,求出各部分能源消耗量隨時間的變化,在隨便扯點內容豐富一下
B題用的 偏最小二乘回歸法 分析各部門(工業,商業,交通等)的消耗量和GDP,人口,天氣等聯繫,求出模擬量。
C題用的TOPSIS D題用的回歸模型和灰度預測。隊友寫的,我不是很了解
Part Ⅱ、Ⅲ主要就是根據第一部分的結果,再補充一些限制條件,就做出來了
(提建議,我加了一條 希望美國重簽巴黎氣候協議 隊友知道了,會不會打我)
最後給個建議,提交論文時候,用QQ郵箱,投遞快,也不知道這投遞是不是跟網速有關係……
占坑。
第一天:六點下載賽題,寫手和建模的選了C題。
八點編程的來了。十二點建模的吃飯去了。兩點編程的說我回家了,不來了。五點建模的去吃飯了。七點寫手回家洗澡了。明天七點換個題從頭再來。
補充一下最新狀況。2018-02-12 22:20
沒換題,寫手負責了全部。編程的第一天就撂挑子不幹了。建模的建了兩個沒用的模型後不幹了。
寫手,一個文科生,決定用經濟學的方法解決全部問題。等出成績會來更新的。學了半年的MATLAB,然後現在用了兩天的excel…
--------------------更新-----------------第一天上午選題,查資料…具體忘了幹啥了第一天下午一直在用Excel人工處理數據,直到我發現了這個網站https://www.eia.gov/state/seds/seds-data-complete.php?sid=CA,於是變成了Excel人工copy數據,很開心哈哈哈哈~不過一開始感覺Excel比較簡單方便,還能直接copy,最後才發現是個坑,數據複雜了之後人工工作量很大。。。下次用Python截止到2018年2月11日21.30知乎上已經陸續的出現了 如何評價美賽x題的問題。
x=[A B C D E F]
各個問題關注的人數為[166 165 369 267 295 56]大概可以判斷出選題的比例為[0.1259 0.1252 0.2800 0.2026 0.2238 0.0425]我還以為e題的人超多,看起來好像也沒那麼多,哇選c題的人好多!別看是大數據,其他題都是先找數據然後變成了大數據題。出題組在和我們賽跑
我們一邊做他們一邊改。。。。。。不管題做的怎麼樣,我總要大力的讚揚EIA!!
EIA做的太優秀了!!
你們都總結的那麼優秀了,還讓我們建個毛啊啊啊啊!!!2.11 9:23
不管題做的怎麼樣,飯總要和美國人吃的一樣。代碼不知道哪錯了-_-||資料資料查不到。那就吃飯吧@_@
2.11 22:09
又來了,我終於知道他為什麼要說 長達一頁 了。2.12 11:58
隊友編參考文獻編到想死,沒見過吧。。。對了另一個隊友在喝酒。2.12 23:50
結束。我掩埋好同伴的屍體,擦乾眼淚,走向我的床。摘要中文寫一上午,和一個隊友改一個小時,撕無數次。排版排四個小時,手抖手抖,不會寫Control sheet了。說好了要做精緻的女孩呢???洗個頭吧。累 死 了。這時候放棄還來的及,我們不能通敵!
絕對不能把真正的模型給老美!!!
沒人發現更新數據了嗎??????
再更一發,一圖應該是知乎的高贊答的一部分,來源想起來補,侵刪.
——就這樣吧——
因為師弟碼的BUG弄得渣糰子從第一問開始從頭做,一個晚上做了6個模型,蒙特卡洛都被我搬出來了...我怕是個礦工吧...拿到SP以上請給我666...
----可怕的更新----
三本辣雞眉頭一皺,發現事情並不簡單——興許是共產黨員國朗普為了保護我國未來棟樑的技術不外流而使出渾身解數對COMAP施加壓力的結果?
--------再更--------
官方玄學,最為致命.
http://www.comap.com/undergraduate/contests/mcm/contests/2018/problems/
Determining the 「Energy profile」 asks the students to select and aggregate what they think is important from the data in the context of the problem and at a level useful to the decision makers, the governors, who don『t want to deal with 650 variables in an equation. This is a basic modeling step, and essential for what follows, which is the longitudinal analysis and then the improvements through policy change.官方題目Update:select and aggregate what they think is important from the datathey think...they......請參考最高贊答,他是對的,emmmmm...
早知道我該打Kaggle而不是MCM/ICMder...-------作死的原答案--------
反正是我隊友做數據標註~
為了騙贊,給一些麵粉糊的腦袋看到題目的時候想到的東西:
OLS.PCA.KPCA.Auto Encoder.VAR.LSTM.ARIMA.
然後是Lasso和Ridge
------更一波順帶懟懟上面那個公號的---------
我拿著600因子庫大手一揮說去除冗餘數據——手動
特徵工程什麼的不存在的
別說三本了,估計我對面的O獎同事也要被立刻炒魷魚
這數據量做特徵工程SAS能超過20min的,建議把電腦扔了吧.
無論結果怎樣,還是贊一下美國社會數據的公開度,和eia真的良心
難很難非常難你們都別選C題,這樣就沒人跟我們競爭了
605個變數,605個坑。
605個Excel陪你肝。
艾瑪、終於寫完了,老年人的身體有點吃不消了。
一個從來沒有參加過數模的辣雞來占坑
2月9號早上起床隊友發了翻譯後的題一個人把每個題都看了一遍看了一上午,沒有頭緒只把目標初步定在!b,c e,三題下午參考文獻出來了考慮了一下選了E然後找了一下午加一晚上的數據無果,10點回家內心真的是mmp了果斷換C題2月10號也就是現在沉迷於C題無法自拔分析數據ing這道題考的是Python的使用吧hhh
其實這題就是很水,掃一遍數據就把特徵清洗到只剩不到10個,哎隊友叫我打代碼了,有空答
如何評價???我看你是有點騷
推薦閱讀:
※在新能源行業里,風能的發展前景如何?
※寧德新能源(atl)高分子研發工程師怎麼樣?
※100平方的屋頂裝光伏發電,成本需要多少?
※線上開講:2017能源應用線上研討論壇
※汽車鋰電池的是使用壽命如何?