中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

<td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>

<rp id="h1kkc"></rp>

曠視科技：聊聊曠廠黑科技-全景視頻實時拼接，看見“視界之外”

2024-08-16 11:42 · 稿源：站長之家用戶

120度，是人類雙眼視野的大致范圍。

為了用更寬闊的視野觀察、記錄這個世界，人們開始使用工具，希望將整個世界都納入畫面中。為此，能同時拍攝整個空間畫面的全景相機出現(xiàn)了。

早期的全景相機需要固定在一個旋轉云臺上，拍攝前擰緊發(fā)條，然后旋轉相機進行拍攝。不僅手段繁瑣，而且由于旋轉速度較慢，拍攝畫面中的人物需要長時間保持固定姿勢。

進入數(shù)碼相機時代，照片的獲得與后期處理變得更加便捷，廠商們各顯神通，全景相機的類型和功能也日益豐富。2006年，瑞士賽茲公司發(fā)布了一臺6x17Digital相機，這個“大家伙”外形尺寸為495x175x95cm，感光器有6x17cm、比較高分辨率達7500x21250px、獲得的相片總像素接近1.6億，并且，僅機身的價格就高達幾十萬人民幣。

為了打破全景相機龐大笨重、售價不菲的特質(zhì)，廠商開始尋求其他的解決方法，“掃描全景模式”就是其中之一。比如索尼HX1，相機在全景拍攝模式下，會在按下快門時快速連續(xù)掃描被攝物體，并在機內(nèi)自動尋找相同色塊自動拼接。該方式面對靜止的物體時能以非常簡單的方式獲得全景拍攝效果，可是卻不能準確判斷畫面中移動的物體，容易形成重影。

與此同時，隨著人們觀察與記錄世界的視角越來越多元化，視頻也成為記錄日常的主要方式之一，能夠容納更多信息、視覺沖擊力更大的全景視頻更是深受人們的喜愛，逐漸成為了主流發(fā)展方向。然而相對于靜態(tài)的全景照片而言，動態(tài)的全景視頻的實現(xiàn)對技術有著更高的要求，硬件升級成本居高不下。

因此，以AI算法彌補硬件升級的不足，打造全景視頻拼接技術成為了新探索方向。

01

拼接技術“曲線救國”，全景視頻痛點依舊

所謂全景視頻拼接技術，即多個攝像頭在同一場景下采集不同方向的視頻，后期逐幀拼接，最終得到360度全景視頻，甚至360度*180度的球面全景視頻。

但是，目前行業(yè)里的全景視頻拼接技術仍存在一些尚未解決的問題。

首先是多攝拼接計算量大。傳統(tǒng)的拼接算法需要提取圖像中的特征點、描述子進行匹配，之后反復迭代得到特出的對齊關系，但在相機標定對齊的過程中會產(chǎn)生大量的計算。

其次是視頻拼接存在明顯拼縫。即使是在計算量非常大的情況下，也需要對于相機之間的關系進行一定的假設，如共光心模型無法適用于大視角，目前即使是網(wǎng)格法求出多組匹配關系也無法應對由于大視角導致的物體拉伸扭曲變形。目前的算法增加了對于扭曲的約束，但不能從根本上解決問題。

另外，還存在拼接無法動態(tài)更新。視頻拼接技術中存在一個普遍的問題，那就是運動物體在重合區(qū)域會產(chǎn)生虛影，就像將手指放在兩眼之間前后移動時會出現(xiàn)虛影一樣。要解決這個問題，需要隨時將相機的光心聚焦到目標點，不斷變換拼接模板;同時，為了使拼接的視頻流暢，還需要考慮到單幀間信息。這意味著每一幀都需要進行特征點、描述子的提取、匹配等一系列操作，需要大量的迭代標定計算。光是單幀的計算量已經(jīng)無法實現(xiàn)實時，更不論多幀的情況。

傳統(tǒng)算法仍存在進步空間，曠視科技決定實現(xiàn)一個基于AI的優(yōu)化算法。

02

對癥下藥找對位置，動態(tài)更新絲般順滑

憑借多年來在基礎科研方面的探索，曠視科技基于光流的多攝AI拼接算法，同時依靠實時動態(tài)無縫拼接網(wǎng)絡模型，推出的全景視頻實時拼接算法，有效解決了多攝拼接計算量大、拼縫明顯以及拼接無法動態(tài)更新的技術難題。

運用了曠視全景視頻實時拼接算法形成的全景視頻，拼縫消失不見，行人經(jīng)過原本拼縫處也流暢自然，不存在割裂感;即使放大很多倍，建筑樓宇上的字跡和遠處建筑的邊緣也依然清晰可見。不僅可視范圍更廣，分辨率更高，動態(tài)更新絲般順滑，且速度比目前已知的較好拼接算法還要再快20倍。

為何曠視全景視頻實時拼接算法，能夠達到這樣的效果?曠視的研究員表示，對癥下藥，才能更好地找到解題秘方。

一方面，全景視頻拼接的趨勢是從一個對齊變換，到多個變換，自然特出的效果應該是每個像素點都有一個對應，因此，曠視科技想到了利用光流來確定目標的運動情況。

另一方面，拼接算法無論是前向還是后向映射，遮擋問題都是一大難題。但是，參考時間上的插幀算法，不僅可以使視頻更清晰流暢，空間上也可以插視角，構造連續(xù)虛擬的視角。

受到這些啟發(fā)，曠視的研究員立即著手進行測試，終于在大半年后取得了突破性的進展，也在多種場景下對拼接質(zhì)量和穩(wěn)定性進行了可視化的評估。

全景視頻實時拼接算法的核心在于把每個物體放到該放的位置上。為此，曠視估計了深度信息、光流信息，構建了一個物理世界并不存在的逐漸緩慢變化的視角，而這個虛構的視角和更大的廣角表示很接近。

由于整個網(wǎng)絡是一個端到端的nn網(wǎng)絡，而光流估計、深度估計都可以在小尺寸上進行，整個算法可以實現(xiàn)實時拼接。

并且，因為構造的虛擬視角無論是在空間上還是在時間上都是連續(xù)的，所以不需要額外考慮幀間關系，拼接的視頻會異常順滑。

03

經(jīng)過優(yōu)化的算法，早已準備好創(chuàng)造價值

算法在需求中誕生，并在落地中創(chuàng)造越來越多的價值;而當下每一個被優(yōu)化的算法，都意味著不久的將來，將會更好地應用于人類社會。

曠視全景視頻實時拼接算法誕生的背后，正是行業(yè)對于全景視頻的巨大需求。未來，全景視頻實時拼接算法將在智慧城市管理、車載相機、消費電子、戶外運動相機等領域被廣泛應用。

例如在道路的交叉口，或者是大型廣場等存在很多視覺盲區(qū)的場景，單個普通攝像頭的視角非常受限，通過全景視頻實時拼接算法形成的全景視頻擁有更寬闊的視野和更高分辨率的圖像，有助于城市管理者實現(xiàn)無盲區(qū)管理。

又比如在汽車駕駛領域，車輛行駛的過程中存在視覺盲區(qū)是引發(fā)交通事故很重要一個因素。如果全景視頻實時拼接算法應用于車載相機中，就能夠觀測到車輛前后左右的情況，助力安全駕駛。

對曠視科技來說，基礎科研是 AI 創(chuàng)新突破的基石，需要長期主義的堅持。從科研到落地，算法正在創(chuàng)造越來越大的價值，也在開始重新定義軟硬件。全景視頻實時拼接算法如此，其它的算法亦然。在曠視技術開放日的現(xiàn)場，還展示了雙目3D相機、單目黑光、實時雙超AI算法等超多的比較新科研成果。

視野所至之處，腳步才有機會到達。在曠視全景視頻實時拼接算法容納的無拼縫、流暢自然的廣闊世界里，沒有“裂縫”的美好生活也會如約而至。

（推廣）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺用戶上傳并發(fā)布，本平臺僅提供信息存儲服務，對本頁面內(nèi)容所引致的錯誤、不確或遺漏，概不負任何法律責任，相關信息僅供參考。站長之家將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。任何單位或個人認為本頁面內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時，可及時向站長之家提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明（點擊查看反饋聯(lián)系地址）。本網(wǎng)站在收到上述法律文件后，將會依法依規(guī)核實信息，溝通刪除相關內(nèi)容或斷開相關鏈接。

相關推薦

關鍵詞：

再獲權威認可！數(shù)勢科技上榜IDC中國AI Agent應用市場全景圖報告

近日，國際數(shù)據(jù)公司（IDC）發(fā)布的《IDC Market Glance:中國AI Agent應用市場概覽，1Q25》（Doc#CHC53057625， 2025 年 3 月）研究報告中，數(shù)勢科技憑借在企業(yè)級智能體應用領域的技術突破，成功入圍"數(shù)據(jù)分析"細分領域代表廠商，成為該賽道智能化轉型的標桿企業(yè)。數(shù)勢科技首發(fā)企業(yè)級決策分析智能體平臺SwiftAgent數(shù)勢科技SwiftAgent 作為基于DeepSeek及行業(yè)先進大模型構建的企業(yè)級智能決策分?
攻克“癌癥之王”難題！我國專家成功繪制全球首份“多組學全景圖譜”

中國醫(yī)學專家歷經(jīng)五年研究，成功繪制出全球首張無功能性胰腺神經(jīng)內(nèi)分泌瘤多組學全景圖譜?；谠搱D譜，專家們創(chuàng)新性提出針對這種沉默腫瘤”的分子分型框架、預后模型及靶向-免疫治療新策略，為臨床精準診療提供了重要參考。更具臨床應用價值的是，研究團隊發(fā)現(xiàn)相關蛋白在患者血漿中的濃度與腫瘤進展顯著相關，這一突破性發(fā)現(xiàn)或?qū)⑼苿釉\療模式從傳統(tǒng)的有創(chuàng)組織活檢”向無創(chuàng)血液檢測”轉變。

?無功能性胰腺神經(jīng)內(nèi)分泌瘤 ?多組學全景圖譜 ?精準診療
春訪工地見真章|成都知希五恒邀您共鑒科技人居新圖景

時值萬物競發(fā)的四月，成都知希五恒科技以匠心為筆，在巴蜀大地繪就了一幅人居升級的生動畫卷。今年一季度，公司迎來交付高峰，除了成都、德陽、綿陽、眉山等主要戰(zhàn)略城市的項目相繼落成外，簡陽、邛崍、達州也被正式點亮。讓我們走進工地，以眼見為實的品質(zhì)，共赴一場關于未來生活的美好約定。

?人居升級 ?科技溫度 ?品質(zhì)實力
蘋果黑科技！AirPods獲新專利：可監(jiān)測用戶呼吸速率

快科技5月2日消息，近日蘋果公司一項關于AirPods的專利獲批，為耳機擴展了一項健康監(jiān)測功能可測量用戶的呼吸速率。專利顯示，AirPods將借助內(nèi)置的內(nèi)部麥克風和外部麥克風，分別采集耳腔內(nèi)和外部環(huán)境的音頻數(shù)據(jù)。系統(tǒng)會對這些音頻流進行分析，提取呼吸相關的頻譜特征，并結合運動類型、心率數(shù)據(jù)等信息，精準計算出呼吸速率。同時，通過機器學習模型優(yōu)化呼吸信號識別，利用盲源分離技術過濾背景噪音。這一功能適用于運動、冥想、日常休息等多種場景，能根據(jù)用戶所處環(huán)境和狀態(tài)調(diào)整音頻處理方式，提供更精準的數(shù)據(jù)，為用戶健康管理提供了新的

?AirPods ?健康監(jiān)測 ?呼吸速率
誰說高性能必須高能耗？揭秘企業(yè)級SSD功耗管理“黑科技”

文章介紹了數(shù)據(jù)中心高密度計算場景下，企業(yè)級SSD功耗管理對優(yōu)化TCO(總體擁有成本)的重要性。憶聯(lián)新一代PCIe Gen5 ESSD UH812a/UH832a通過創(chuàng)新散熱設計、智能算法和硬件協(xié)同，實現(xiàn)高性能與低功耗平衡：優(yōu)化DRAM緩存技術降低發(fā)熱量，外殼散熱設計提升散熱能力；支持多檔位功耗模式動態(tài)調(diào)節(jié)，實測隨機讀/寫功耗分別低至17W/22W；內(nèi)置功耗檢測電路，實時監(jiān)測誤差<3%；待機功耗<5W，比同類產(chǎn)品溫度低3-12℃。該方案可幫助數(shù)據(jù)中心降低非IT設備能耗，實現(xiàn)更優(yōu)PUE指標。

?數(shù)據(jù)中心 ?企業(yè)級SSD ?功耗管理
比其它平臺晚了幾年！Apple Music Windows版本終于有了杜比全景聲

近日，蘋果在AppleMusicforWindows10/11版本中添加了杜比全景聲支持，讓Windows用戶也能享受到沉浸式的音樂體驗。此前AppleMusic的其他版本，如iOS版、iPadOS版、Mac版、AppleTV版和Android版都已經(jīng)在2021年之后陸續(xù)支持杜比全景聲，但Windows用戶一直未能享受到這一功能。需要注意的是，AppleMusic沒有免費版，用戶需要訂閱后才能收聽。

?蘋果 ?Apple ?Music
快手亮相第五屆中國國際消費品博覽會，“黑科技”激發(fā)消費活力

4 月 13 日至 18 日，第五屆中國國際消費品博覽會在海南省啟幕，本屆消博會以“共享開放機遇，共創(chuàng)美好生活”為主題，聚焦消費精品和前沿科技，著力打造“科技+消費”深度融合的數(shù)字化新生態(tài)，為全球客商呈現(xiàn)中國消費市場的創(chuàng)新活力與科技魅力。

?快手 ?快手直播 ?AIGC
薦馬斯克炫酷變身毒液！實測通義Wan2.1首尾幀視頻模型，還能“拼接”經(jīng)典梗圖

在GitHub狂攬1w+星標的通義萬相Wan2.1，又雙叒上新了!最新打開方式是醬嬸兒的:給出開始（首幀）和結束(尾幀)兩張圖片，Wan2.1便能分分鐘生成一段絲滑的5s、720p視頻。根據(jù)前后視角的不同，還能自動調(diào)整鏡頭角度，緩慢變成高空俯拍，并同時保證人物光影正確:原來這是阿里通義萬相Wan2.1最新開源的首尾幀視頻模型，基于Wan2.1文生視頻14B大模型，為創(chuàng)作者們提供更高效、更靈活的

?視頻生成 ?開源模型 ?阿里通義萬相
美股全線暴跌！科技“七姐妹”全崩了蘋果、亞馬遜、英偉達最慘

美國總統(tǒng)特朗普4月2日宣布對貿(mào)易伙伴加征所謂對等關稅”，加劇了全球貿(mào)易戰(zhàn)的風險，市場反映強烈。當?shù)貢r間4月4日，美國股市連續(xù)第二天遭受重創(chuàng)，當日收盤暴跌。其他四只股票，總市值蒸發(fā)720億美元-2000億美元不等。

?全球貿(mào)易戰(zhàn) ?特朗普加稅 ?美股暴跌
馬上消金：金融科技智能化與安全化并重的未來趨勢

近日，國際知名咨詢機構普華永道發(fā)布《 2025 全球八大金融科技趨勢：專利視角》報告，深入剖析了全球金融科技的發(fā)展趨勢。報告指出，在全球新一輪科技革命和產(chǎn)業(yè)變革的浪潮下，金融科技已成為全球數(shù)字產(chǎn)業(yè)發(fā)展的核心驅(qū)動力，其創(chuàng)新正邁入“智能”與“安全”并重的新時代。報告對全球金融機構的專利申請量進行了盤點和分析。數(shù)據(jù)顯示，中國在全球金融科技專利申?

?金融科技 ?國際咨詢機構 ?全球趨勢

熱文

3 天
7天

站長商機

廣告

商務合作侵權投訴廣告服務版權聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<small id="11111"><optgroup id="11111"><ul id="11111"></ul></optgroup></small>