日本一区不卡在线观看,亚洲视频在线网站,久久精品免费观看久久,七月婷婷丁香,国产成人免费在线视频,www.日本黄色,精品欧美日韩一区二区三区

農(nóng)業(yè)無人機
工業(yè)無人機
軍警無人機
娛教無人機
水下無人機
反無人機設備
無人機配件
無人機租賃
無人機培訓
當前位置:全球無人機網(wǎng) ? 無人機技術 ? DIY ? 正文

200美元“造”出一臺可由語音控制外加能進行人臉識別的自主飛行無人機

發(fā)布日期:2016-11-18??來源:Parrot派諾特我要投稿我要評論

    運用語音來控制無人機

進行語音識別部分開發(fā)的難點并不是識別本身,而是如何把語音流從運行在我本地服務器上的網(wǎng)頁里轉換成微軟Speech API可以使用格式。下面的代碼就是實現(xiàn)這個功能的。一旦你能把語音保存成單聲道和以正確的采樣頻率采樣后,這個語音識別API就能很方便地識別語音內(nèi)容。這個API的花費是1000次請求4美元。對于業(yè)余應用來說,基本相當于是免費了。

RecordRTC是一個很好的庫,可以用來作為以網(wǎng)頁為客戶端的語音采集的新手入門的工具。在客戶端,我就加入了保存語音文件的代碼。

app.post(‘/audio’, function(req, res) {

var form = new formidable.IncomingForm();

// 設定允許客戶在一個請求里上傳多個文件

form.multiples = true;

form.uploadDir = path.join(__dirname, ‘/uploads’);

form.on(‘file’, function(field, file) {

filename = “audio.wav”

fs.rename(file.path, path.join(form.uploadDir, filename));

});

// 記錄發(fā)生的錯誤日志

form.on(‘error’, function(err) {

console.log(‘An error has occured: \n’ + err);

});

// 一旦所有文件上傳完成,才給客戶端發(fā)相應

form.on(‘end’, function() {

res.end(‘success’);

});

// 解析出請求里包含的表單數(shù)據(jù)

form.parse(req)

speech.parseWav(‘uploads/audio.wav’, function(text) {

console.log(text);

controlDrone(text);

});

});

我使用FFmpeg工具來降低音頻的采樣率,并把多聲道合并成單聲道,以供微軟API使用。

exports.parseWav = function(wavPath, callback) {

var cmd = ‘ffmpeg -i ‘ + wavPath + ‘ -ar 8000 -ac 1 -y tmp.wav’;

exec(cmd, function(error, stdout, stderr) {

console.log(stderr); // command output is in stdout

});

postToOxford(callback);

});

盡管我開發(fā)的功能就是這些,但是還是可以繼續(xù)擴展。比如用微軟的文字變語音的API來讓無人機說話!

    開發(fā)自主搜索路徑


我使用ardrone-autonomy庫來為無人機開發(fā)自主搜索路徑。在此過程中,我無數(shù)次地把無人機弄得撞到了客廳的家具和植物上。最后,我妻子很“客氣”地建議我去車庫里繼續(xù)我的項目,因為那里沒多少可以撞的東西。但是車庫的地方有點小,使得操控空間有限。



圖3:在我的“實驗室”里試飛無人機。圖片由Lukas Biewald授權使用

在我能有一個更大的實驗空間后,我會嘗試更智能的搜索算法。不過,現(xiàn)在我還是只會讓無人機做起飛和旋轉的動作,以此來搜索發(fā)現(xiàn)人,并識別是敵還是友。

var autonomy = require(‘ardrone-autonomy’);

var mission = autonomy.createMission({ip: ‘10.0.1.3’, frameRate: 1, imageSize: ‘640:320’});

console.log(“Here we go!”)

mission.takeoff()

.zero()         // 把當前狀態(tài)作為參考基準

.altitude(1)

.taskSync(console.log(“Checkpoint 1”))

.go({x: 0, y: 0, z: 1, yaw: 90})

.taskSync(console.log(“Checkpoint 2”))

.hover(1000)

.go({x: 0, y: 0, z: 1, yaw: 180})

.taskSync(console.log(“Checkpoint 3”))

.hover(1000)

.go({x: 0, y: 0, z: 1, yaw: 270})

.taskSync(console.log(“Checkpoint 4”));

.hover(1000)

.go({x: 0, y: 0, z: 1, yaw: 0

.land()

    全都搞定后的效果

看下面的視頻。我讓無人機起飛并去找我的朋友Chris:

    結論

在一切都配置妥當之后,就可以通過API來控制無人機,獲得拍攝到的視頻圖片,這一切都爽爆了!隨著新的圖像識別技術可供使用,可能的應用必將越來越多。比如,讓無人機根據(jù)房屋平面圖來刷墻。雖然Parrot無人機并不是設計來為在狹小空間(比如我的房子)里安全飛行的,但隨著無人機越來越皮實,價格變得更低,我相信真正有用的應用將會進入爆發(fā)期。

微軟的認知服務云API是相當?shù)煤糜们冶阋恕W畛跷冶容^擔心無人機所用的廣角攝像頭所拍攝的圖片會影響人臉識別的準確度,另外螺旋槳的噪聲可能會對語音識別產(chǎn)生干擾。但整體而言,這兩個API的表現(xiàn)遠超我的期望。同時處理延遲也低于我的預期。從架構設計角度來看,在云端運行機器學習實時圖像處理似乎是一個奇怪的選擇,但它可能會成為未來很多應用的架構選擇。

Lukas Biewald

Lukas Biewald是CrowdFlower的創(chuàng)始人兼CEO。CrowdFlower始于2009年,是一個數(shù)據(jù)增強的平臺,可以幫助企業(yè)獲得隨需的人力來收集、產(chǎn)生訓練數(shù)據(jù),以及參與人-機器學習循環(huán)的工作。 在從斯坦福大學拿到數(shù)學學士和計算機科學碩士學位后,Lukas領導了雅虎日本的搜索相關團隊。隨后他去了Powerset,作為一個資深數(shù)據(jù)科學家進行工作。2008年Powerset被微軟收購。Lukas還被《公司》雜志評選為30位30歲以下的著名人士。 Lukas還是一位專家級的圍棋選手。
?
本文鏈接:http://www.mrc-fc.com/tech/201611/18/209.html
標簽:??
0相關評論
免責聲明:凡注明來源全球無人機網(wǎng)的所有作品,均為本網(wǎng)合法擁有版權或有權使用的作品,歡迎轉載,請注明出處。非本網(wǎng)作品均來自互聯(lián)網(wǎng),轉載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。

圖文推薦

推薦新聞

推薦品牌

關于本站

合作服務電話

  • 客服熱線:0755-23779287
  • 展會負責:18682042306
  • 廣告合作:點擊這里給我發(fā)消息
  • 展會合作:點擊這里給我發(fā)消息

公眾號/APP下載


    (公眾號)


    (Android下載)

Copyright?2005-2021 81UAV.CN All Rights Reserved? 訪問和使用全球無人機網(wǎng),即表明您已完全接受和服從我們的用戶協(xié)議。 SITEMAPS 網(wǎng)站地圖 網(wǎng)站留言
運營商: 湛江中龍網(wǎng)絡科技有限公司 全球無人機網(wǎng)?
ICP備案號:粵ICP備2023038372號-1 
全國公安機關?備案信息?可信網(wǎng)站不良舉報?文明轉播