視頻的縮略圖是根據什麼原理自動選取的?

一段視頻存到電腦里之後會自動配上一個縮略圖,而且在各種設備中顯示的縮略圖都一樣,這個縮略圖是根據什麼原理生成的?可以修改嗎?


原理不懂~
但是對於MP4WMV這兩種格式有個最快速的修改方法(其它視頻格式不適用),

超……超……超…………超快速!!!

需要用到Foobar2000Mp3tag這兩個軟體,
因為極少數情況會遇到Foobar2000修改不了,那就換用MP3tag修改。

我選用了一個體積較大的視頻文件(2.6G),
因為小文件,幾百M的基本上都是一兩秒鐘就修改完成了,看一下大文件修改耗時多久……

↓↓↓↓↓↓↓使用Foobar2000修改的方法 ↓↓↓↓↓↓↓

等待轉換過程耗時1分12秒25修改完成~

↓↓↓↓↓↓↓使用Mp3tag修改的方法 ↓↓↓↓↓↓↓

等待轉換過程耗時1分32秒84

修改後的視頻縮略圖效果是一樣的,雖然轉換過程略慢於Foobar2000,但是Mp3tag的優點在於,它還可以把視頻的封面提取出來(如果視頻設置有封面的話),如果刪除封面,視頻就會恢復原來的默認縮略圖。

說個題外話,在選擇圖片尺寸時需要注意一個細節,如果你的圖片是橫矩形的(比如1177X486)
或者是豎矩形的(比如484X485),修改後的縮略圖是有區別的:

雖然我平時是用來修改MP3音頻的縮略圖用的~


ffmpeg中的thumbnail filter:

https://github.com/FFmpeg/FFmpeg/blob/master/libavfilter/vf_thumbnail.c

Potential thumbnail lookup filter to reduce the risk of an inappropriate selection (such as a black frame) we could get with an absolute seek. Simplified version of algorithm by Vadim Zaliva &. see http://notbrainsurgery.livejournal.com/29773.html

http://notbrainsurgery.livejournal.com/29773.html 上可以看到函數的實現思路:

The main idea is very simple: we analyze first few seconds of a clip and build histograms of color distribution per frame. Then, we average them, building an averaged color distribution histogram. Then we find a frame, which is closest to the average value (I am using RMSE to estimate "closeness"). We select a frame close to beginning of the video, which makes selection process faster (less frames to examine) and less likely to include spoilers. Selected picture is similar in color distribution to the overall video theme, making it more likely to display typical frame.

具體的源代碼網頁404了,只能看ffmpeg使用的簡化版。大概就是對視頻前幾秒的顏色分布直方求平均,再找出和平均值最相近的一幀作為縮略圖。只用前幾秒是為了節省計算時間。

當然這只是ffmpeg的實現方式,不同的軟體或視頻網站可能採用不同的方案,比如YouTube可以使用神經網路自動生成縮略圖。有些實現採用了動作識別和人臉識別(Key frame selection to represent a video)來選擇。

知道原理好像也沒什麼卵用..


根據我的經驗,在windows一般都是第一幀,如:FBI WARNING.澳門首家線上賭場什麼的


17年5月4日修改,本來覺得沒什麼人看,就算了,今天看見有一個感謝,覺得心裡不太舒服(有誤導人的嫌疑),乾脆再好好看一下,在原答案的基礎上改一下,為方便,不貼圖了。

AVI格式,4分10秒的視頻,略縮圖是第5秒18幀

AVI格式,6分10秒的視頻,略縮圖是第47秒10幀

(上面兩個視頻是相同的視頻,只是速度不同,結果差的很多!)

MP4格式,1分50秒的視頻,略縮圖是第4秒20幀

MP4格式,1分32秒的視頻,略縮圖是第4秒24幀

完全打破了我先前的猜想,和第3秒29幀沒半毛錢關係......

原理已經有人貼出來了,就不扯了(也沒看懂)

原答案如下

-------------------------------------------------

這麼好的問題竟然沒人答!

首先聲明,我是在百度上搜索這個問題,發現沒有答案,又來知乎,竟然還是沒有答案!

但我研究了一下,希望能對題主有幫助。

我是在幫班裡的美女團支書做完視頻之後發現這個問題的,

(請不要糾結我的電腦桌面)

幫美女團支書做完參賽視頻是這個樣子的

很low!有沒有!

我做視頻習慣先AE,後pr,所有這個視頻最後的處理場所是PR

這明眼人一眼就看得出來,是視頻剛開始的時候嘛!

這是難不住我的,果斷在視頻里挑了一幀最好看的,提取幀,然後插到開頭,只插入了一幀!

然後,等待了兩個小時!(筆記本)

視頻導出來,還是這個鬼樣子!

總結一下,略縮圖不是第一幀,

然而我想幫美女做事兒的動機促使我研究了一下,

這是我另外做的一個視頻

(這個不打碼了...反正那麼小!)

然後這是播放時候的第一幀

然後繼續往下看,在視頻播放到第三秒的時候

(大家看手就可以了...)

這是第三秒,也就是大約50幀到70幀的樣子

視頻的略縮圖,就是在這一段中間提取出來的一幀!

(閑著也是閑著,就仔細的找一找吧)

圖標弄大點

我找到了視頻的pr文件(大部分都離線了,但開頭還在)

然後打開,有一個好辦法,就是一幀一幀的搜索!

就是它了!看下時間!00:00:03:29

得出答案!MP4視頻,在電腦上顯示的略縮圖!

是這個視頻第三秒的最後一張!

這好像是個神奇的巧合!

但我想不出來這有什麼意義!!!

這真是一個好反人類的設定!

我不能為美女團支書改略縮圖了...

哦,差了題主一個問題,可以修改的,用一些視頻編輯軟體替換掉那一幀就可以了,但是播放起來就不會再好了...


Mac在iTunes裡面可以自己選擇poster frame


可以設置後台上傳封面圖,也可以抓取視頻里隨意的一幀,也可以第一幀…後兩種基本沒人選…


謝邀
樓上很厲害
我還真的沒想過這個問題…
不過印象中一些轉碼軟體有個選項,你可以自己選擇視頻中的一幀當作縮略圖~


推薦閱讀:

TAG:視頻 | 格式 | 縮略圖 | media | 資源管理器 |