fix bar
fix bar
fix bar
fix bar
fix bar
fix bar

Massive-scale online collaboration | Luis von Ahn

TED

Alterar formato do vídeo:

Ocultar legendas incorporadas

Tela 4:3 ou 16:9 (Padrão)

Alterar modo de reprodução

Modo atual: Tocar e Pausar

Tocar normalmente

Lento Devagar Normal
Rápido
Acelerado
Frenético
 


. . .



 


. . .



 

00:00...
...

[1] 00:15How many of you had to fill out some sort of web form
Tradutor: Ana Luísa Bernardino Revisora: Nuno Couto

[2] 00:17where you've been asked to read a distorted sequence of characters like this?
Já tiveram de preencher um formulário na web

[3] 00:19How many of you found it really, really annoying?
onde pedem para lerem caracteres distorcidos como estes?

[4] 00:21Okay, outstanding. So I invented that.
Não acharam isso muito irritante?

[5] 00:24(Laughter)
(Risos)

[6] 00:26Or I was one of the people who did it.
Espetacular. Fui eu que inventei isso.

[7] 00:28That thing is called a CAPTCHA.
(Risos)

[8] 00:30And the reason it is there is to make sure you, the entity filling out the form,
Fui um dos que inventou isso.

[9] 00:32are actually a human and not some sort of computer program
Esta coisa chama-se um CAPTCHA.

[10] 00:35that was written to submit the form millions and millions of times.
Serve para certificar que quem preenche o formulário,

[11] 00:37The reason it works is because humans,
é uma pessoa e não um programa informático

[12] 00:39at least non-visually-impaired humans,
desenvolvido para submeter o formulário milhões de vezes.

[13] 00:41have no trouble reading these distorted squiggly characters,
Funciona porque as pessoas, que não tenham limitações visuais

[14] 00:43whereas computer programs simply can't do it as well yet.
não têm problema em ler estes caracteres distorcidos,

[15] 00:46So for example, in the case of Ticketmaster,
mas os programas informáticos ainda não o conseguem fazer

[16] 00:48the reason you have to type these distorted characters
Por exemplo, no caso do Ticketmaster,

[17] 00:50is to prevent scalpers from writing a program
temos de escrever estes caracteres distorcidos

[18] 00:52that can buy millions of tickets, two at a time.
para impedir que os burlões comprem

[19] 00:54CAPTCHAs are used all over the Internet.
milhões de bilhetes, dois de cada vez.

[20] 00:56And since they're used so often,
Usam-se CAPTCHAs em toda a Internet.

[21] 00:58a lot of times the precise sequence of random characters that is shown to the user
Como são usados com muita frequência,

[22] 01:00is not so fortunate.
nem sempre é feliz a sequência de caracteres aleatórios

[23] 01:02So this is an example from the Yahoo registration page.
que é mostrada ao utilizador

[24] 01:05The random characters that happened to be shown to the user
Este exemplo é da página de registo do Yahoo.

[25] 01:07were W, A, I, T, which, of course, spell a word.
Os caracteres aleatórios que aparecem

[26] 01:10But the best part is the message
são W, A, I, T [esperem], que formam uma palavra.

[27] 01:13that the Yahoo help desk got about 20 minutes later.
Mas a melhor parte é a mensagem

[28] 01:16Text: "Help! I've been waiting for over 20 minutes, and nothing happens."
que os serviços do Yahoo receberam uns 20 minutos depois.

[29] 01:19(Laughter)
[Socorro! Estou à espera há mais de 20 minutos e não acontece nada]

[30] 01:23This person thought they needed to wait.
(Risos)

[31] 01:25This of course, is not as bad as this poor person.
Esta pessoa achava que tinha de esperar.

[32] 01:28(Laughter)
Mas é muito melhor do que este, coitado.

[33] 01:30CAPTCHA Project is something that we did here at Carnegie Melllon over 10 years ago,
[Reiniciar]

[34] 01:33and it's been used everywhere.
(Risos)

[35] 01:35Let me now tell you about a project that we did a few years later,
Desenvolvemos o projeto CAPTCHA aqui na Carnegie Mellon há 10 anos

[36] 01:37which is sort of the next evolution of CAPTCHA.
e está a ser usado por toda a parte.

[37] 01:40This is a project that we call reCAPTCHA,
Vou falar-vos de um projeto que desenvolvemos anos depois,

[38] 01:42which is something that we started here at Carnegie Mellon,
que é uma espécie de evolução do CAPTCHA.

[39] 01:44then we turned it into a startup company.
É um projeto a que chamamos reCAPTCHA,

[40] 01:46And then about a year and a half ago,
que começámos aqui na Carnegie Mellon,

[41] 01:48Google actually acquired this company.
e que transformámos depois numa empresa.

[42] 01:50So let me tell you what this project started.
Há cerca de um ano e meio,

[43] 01:52So this project started from the following realization:
a Google comprou esta empresa.

[44] 01:55It turns out that approximately 200 million CAPTCHAs
Vou dizer-vos o que este projeto começou.

[45] 01:57are typed everyday by people around the world.
Este projeto começou através da seguinte perceção:

[46] 02:00When I first heard this, I was quite proud of myself.
Escrevem-se cerca de 200 milhões de CAPTCHAs

[47] 02:02I thought, look at the impact that my research has had.
todos os dias, por pessoas em todo o mundo.

[48] 02:04But then I started feeling bad.
Quando soube disto, senti-me muito orgulhoso e pensei:

[49] 02:06See here's the thing, each time you type a CAPTCHA,
"Que impacto que a minha investigação tem tido!".

[50] 02:08essentially you waste 10 seconds of your time.
Mas depois comecei a sentir-me mal.

[51] 02:11And if you multiply that by 200 million,
Porque, sempre que escrevemos um CAPTCHA,

[52] 02:13you get that humanity as a whole is wasting about 500,000 hours every day
desperdiçamos 10 segundos do nosso tempo.

[53] 02:16typing these annoying CAPTCHAs.
Se multiplicarmos isso por 200 milhões,

[54] 02:18So then I started feeling bad.
a humanidade está a gastar cerca de 500 000 horas por dia

[55] 02:20(Laughter)
a escrever estes irritantes CAPTCHAs.

[56] 02:22And then I started thinking, well, of course, we can't just get rid of CAPTCHAs,
Por isso, comecei a sentir-me mal.

[57] 02:25because the security of the Web sort of depends on them.
(Risos)

[58] 02:27But then I started thinking, is there any way we can use this effort
Depois comecei a pensar:

[59] 02:30for something that is good for humanity?
"Não nos podemos livrar dos CAPTCHAs,

[60] 02:32So see, here's the thing.
"porque a segurança da web depende deles."

[61] 02:34While you're typing a CAPTCHA, during those 10 seconds,
"Existirá alguma forma de utilizar este esforço

[62] 02:36your brain is doing something amazing.
"para qualquer coisa boa para a humanidade?"

[63] 02:38Your brain is doing something that computers cannot yet do.
Então vejam isto.

[64] 02:40So can we get you to do useful work for those 10 seconds?
Nos 10 segundos, em que escrevem o CAPTCHA,

[65] 02:43Another way of putting it is,
o cérebro está a fazer algo fascinante.

[66] 02:45is there some humongous problem that we cannot yet get computers to solve,
Faz uma coisa que os computadores não conseguem fazer.

[67] 02:47yet we can split into tiny 10-second chunks
Como conseguir fazer algo útil durante esses 10 segundos?

[68] 02:50such that each time somebody solves a CAPTCHA
Ou seja, há um enorme problema

[69] 02:52they solve a little bit of this problem?
que os computadores não resolvem.

[70] 02:54And the answer to that is "yes," and this is what we're doing now.
Será que podemos dividi-lo em períodos de 10 segundos

[71] 02:56So what you may not know is that nowadays while you're typing a CAPTCHA,
e que, quando alguém escreve um CAPTCHA,

[72] 02:59not only are you authenticating yourself as a human,
se resolva uma parte desse problema?

[73] 03:01but in addition you're actually helping us to digitize books.
A resposta é "sim", e é oque estamos a fazer agora.

[74] 03:03So let me explain how this works.
Por isso, hoje em dia, quando escrevem um CAPTCHA,

[75] 03:05So there's a lot of projects out there trying to digitize books.
estão a autenticar-se como pessoas,

[76] 03:07Google has one. The Internet Archive has one.
e estão a ajudar-nos a digitalizar livros.

[77] 03:10Amazon, now with the Kindle, is trying to digitize books.
Vou explicar como é que isso funciona.

[78] 03:12Basically the way this works
Há imensos projetos a tentar digitalizar livros.

[79] 03:14is you start with an old book.
A Google tem um. O Internet Archive tem um.

[80] 03:16You've seen those things, right? Like a book?
A Amazon, com o Kindle, está a tentar digitalizar livros.

[81] 03:18(Laughter)
Isto funciona assim:

[82] 03:20So you start with a book, and then you scan it.
Começa-se por pegar num livro antigo, físico.

[83] 03:22Now scanning a book
Já viram uma coisa destas? Um livro?

[84] 03:24is like taking a digital photograph of every page of the book.
(Risos)

[85] 03:26It gives you an image for every page of the book.
Começam com um livro e digitalizam-no.

[86] 03:28This is an image with text for every page of the book.
Digitalizar um livro

[87] 03:30The next step in the process
é como tirar uma fotografia digital de cada página do livro.

[88] 03:32is that the computer needs to be able to decipher all of the words in this image.
Uma imagem para cada página do livro.

[89] 03:35That's using a technology called OCR,
Uma imagem com texto para cada página do livro.

[90] 03:37for optical character recognition,
O passo seguinte é o computador conseguir decifrar

[91] 03:39which takes a picture of text
todas as palavras nessa imagem.

[92] 03:41and tries to figure out what text is in there.
Usa-se uma tecnologia chamada OCR,

[93] 03:43Now the problem is that OCR is not perfect.
Reconhecimento Ótico de Caracteres,

[94] 03:45Especially for older books
que tira uma fotografia do texto

[95] 03:47where the ink has faded and the pages have turned yellow,
e tenta descobrir que texto está lá.

[96] 03:50OCR cannot recognize a lot of the words.
O problema é que o OCR não é perfeito.

[97] 03:52For example, for things that were written more than 50 years ago,
Especialmente para livros mais antigos

[98] 03:54the computer cannot recognize about 30 percent of the words.
com tinta a falhar e páginas amareladas,

[99] 03:57So what we're doing now
OCR não consegue reconhecer muitas das palavras.

[100] 03:59is we're taking all of the words that the computer cannot recognize
Nas coisas que foram escritas há mais de 50 anos,

[101] 04:01and we're getting people to read them for us
o computador não reconhece cerca de 30% das palavras.

[102] 04:03while they're typing a CAPTCHA on the Internet.
Portanto, extraímos todas as palavras

[103] 04:05So the next time you type a CAPTCHA, these words that you're typing
que o computador não consegue reconhecer

[104] 04:08are actually words that are coming from books that are being digitized
e pomos pessoas a lê-las para nós

[105] 04:11that the computer could not recognize.
enquanto escrevem um CAPTCHA na Internet.

[106] 04:13And now the reason we have two words nowadays instead of one
Quando escreverem um CAPTCHA, a palavra que escreverem

[107] 04:15is because, you see, one of the words
é uma palavra que sai de livros que estão a ser digitalizados

[108] 04:17is a word that the system just got out of a book,
e que o computador não conseguiu reconhecer.

[109] 04:19it didn't know what it was, and it's going to present it to you.
Agora temos duas palavras, em vez de uma,

[110] 04:22But since it doesn't know the answer for it, it cannot grade it for you.
porque uma das palavras foi retirada de um livro

[111] 04:25So what we do is we give you another word,
que o sistema não conseguia ler.

[112] 04:27one for which the system does know the answer.
Mas como não sabe a resposta, não consegue dizer-vos que palavra é.

[113] 04:29We don't tell you which one's which, and we say, please type both.
Por isso, dá-vos outra palavra,

[114] 04:31And if you type the correct word
para a qual o sistema conhece a resposta.

[115] 04:33for the one for which the system already knows the answer,
Não dizemos qual é qual. Pedimos para escrever as duas.

[116] 04:35it assumes you are human,
Se escreverem a palavra correta

[117] 04:37and it also gets some confidence that you typed the other word correctly.
que o sistema já conhece,

[118] 04:39And if we repeat this process to like 10 different people
ele assume que vocês são humanos,

[119] 04:42and all of them agree on what the new word is,
e acha que escreveram bem a outra palavra.

[120] 04:44then we get one more word digitized accurately.
Se repetirmos este processo com 10 pessoas diferentes

[121] 04:46So this is how the system works.
e todas elas concordarem qual é a nova palavra,

[122] 04:48And basically, since we released it about three or four years ago,
então temos mais uma palavra digitalizada corretamente.

[123] 04:51a lot of websites have started switching
É assim que o sistema funciona.

[124] 04:53from the old CAPTCHA where people wasted their time
Desde que o lançámos há três ou quatro anos,

[125] 04:55to the new CAPTCHA where people are helping to digitize books.
muitos websites já começaram a mudar

[126] 04:57So for example, Ticketmaster.
do CAPTCHA onde as pessoas perdiam tempo

[127] 04:59So every time you buy tickets on Ticketmaster, you help to digitize a book.
para o novo CAPTCHA, ajudando a digitalizar livros.

[128] 05:02Facebook: Every time you add a friend or poke somebody,
Por exemplo, o Ticketmaster.

[129] 05:04you help to digitize a book.
Quando compram bilhetes no Ticketmaster, ajudam a digitalizar um livro.

[130] 05:06Twitter and about 350,000 other sites are all using reCAPTCHA.
Facebook: Quando adicionam um amigo

[131] 05:09And in fact, the number of sites that are using reCAPTCHA is so high
estão a ajudar a digitalizar um livro.

[132] 05:11that the number of words that we're digitizing per day is really, really large.
O Twitter e cerca de 350 000 websites estão a usar o reCAPTCHA.

[133] 05:14It's about 100 million a day,
O número de sites a usar o reCAPTCHA é tão grande

[134] 05:16which is the equivalent of about two and a half million books a year.
que o número de palavras que digitalizamos por dia é muito grande.

[135] 05:20And this is all being done one word at a time
É cerca de 100 milhões por dia,

[136] 05:22by just people typing CAPTCHAs on the Internet.
o que equivale a dois milhões e meio de livros por ano.

[137] 05:24(Applause)
Tudo isto é feito, palavra-a-palavra

[138] 05:32Now of course,
apenas com a escrita de CAPTCHAs na Internet.

[139] 05:34since we're doing so many words per day,
(Aplausos)

[140] 05:36funny things can happen.
Agora, claro,

[141] 05:38And this is especially true because now we're giving people
já que estamos a conseguir tantas palavras por dia,

[142] 05:40two randomly chosen English words next to each other.
podem acontecer situações engraçadas.

[143] 05:42So funny things can happen.
Estamos a dar às pessoas

[144] 05:44For example, we presented this word.
duas palavras escolhidas ao acaso, em conjunto.

[145] 05:46It's the word "Christians"; there's nothing wrong with it.
Podem acontecer coisas engraçadas.

[146] 05:48But if you present it along with another randomly chosen word,
Por exemplo, demos a palavra "cristãos".

[147] 05:51bad things can happen.
Nada de especial.

[148] 05:53So we get this. (Text: bad christians)
Mas se a apresentarmos com outra escolhida ao acaso,

[149] 05:55But it's even worse, because the particular website where we showed this
podem acontecer coisas más.

[150] 05:58actually happened to be called The Embassy of the Kingdom of God.
Por exemplo. [Maus cristãos]

[151] 06:01(Laughter)
Mas pior ainda, porque o site em que mostrámos isto

[152] 06:03Oops.
calhou chamar-se "A Embaixada do Reino de Deus".

[153] 06:05(Laughter)
(Risos)

[154] 06:08Here's another really bad one.
Aqui está outra bem má.

[155] 06:10JohnEdwards.com
JohnEdwards.com

[156] 06:12(Text: Damn liberal)
[Maldito liberal]

[157] 06:15(Laughter)
(Risos)

[158] 06:17So we keep on insulting people left and right everyday.
Estamos sempre a insultar pessoas por todo o lado.

[159] 06:20Now, of course, we're not just insulting people.
Mas não estamos só a insultar pessoas.

[160] 06:22See here's the thing, since we're presenting two randomly chosen words,
Como apresentamos duas palavras escolhidas ao acaso,

[161] 06:25interesting things can happen.
podem acontecer coisas interessantes.

[162] 06:27So this actually has given rise
Isto gerou um burburinho famoso na Internet

[163] 06:29to a really big Internet meme
em que já participaram dezenas de milhares de pessoas

[164] 06:32that tens of thousands of people have participated in,
que se chama: "CAPTCHA art".

[165] 06:34which is called CAPTCHA art.
Já devem ter ouvido falar nele.

[166] 06:36I'm sure some of you have heard about it.
Funciona assim:

[167] 06:38Here's how it works.
Imaginem que veem um CAPTCHA

[168] 06:40Imagine you're using the Internet and you see a CAPTCHA
que acham que é, de certa forma, esquisito,

[169] 06:42that you think is somewhat peculiar,
como este CAPTCHA

[170] 06:44like this CAPTCHA. (Text: invisible toaster)
[Torradeira invisível]

[171] 06:46Then what you're supposed to do is you take a screen shot of it.
Depois, supostamente, faz-se um printscreen.

[172] 06:48Then of course, you fill out the CAPTCHA
e preenchem o CAPTCHA,

[173] 06:50because you help us digitize a book.
porque estão a ajudar a digitalizar um livro.

[174] 06:52But then, first you take a screen shot,
Mas depois, fazem o printscreen

[175] 06:54and then you draw something that is related to it.
e desenham algo relacionado com ele.

[176] 06:56(Laughter)
(Risos)

[177] 06:58That's how it works.
É assim que funciona.

[178] 07:01There are tens of thousands of these.
Há dezenas de milhares destes.

[179] 07:04Some of them are very cute. (Text: clenched it)
Alguns são adoráveis.

[180] 07:06(Laughter)
[consegui-o]

[181] 07:08Some of them are funnier.
(Risos)

[182] 07:10(Text: stoned founders)
Outros são mais divertidos.

[183] 07:13(Laughter)
[Fundadores pedrados]

[184] 07:16And some of them,
(Risos)

[185] 07:18like paleontological shvisle,
E alguns deles,

[186] 07:21they contain Snoop Dogg.
como "paleontological shvisle"

[187] 07:23(Laughter)
contêm o Snoop Dogg.

[188] 07:26Okay, so this is my favorite number of reCAPTCHA.
(Risos)

[189] 07:28So this is the favorite thing that I like about this whole project.
Ok, este é o meu número preferido do reCAPTCHA.

[190] 07:31This is the number of distinct people
É a minha coisa preferida em todo este projeto.

[191] 07:33that have helped us digitize at least one word out of a book through reCAPTCHA:
É o número de pessoas que nos ajudaram a digitalizar

[192] 07:36750 million,
pelo menos uma palavra de um livro através do reCAPTCHA:

[193] 07:38which is a little over 10 percent of the world's population,
750 mil milhões,

[194] 07:40has helped us digitize human knowledge.
um pouco mais de 10% da população mundial,

[195] 07:42And it is numbers like these that motivate my research agenda.
que nos ajudou a digitalizar o conhecimento humano.

[196] 07:45So the question that motivates my research is the following:
São números como estes que motivam a minha investigação.

[197] 07:48If you look at humanity's large-scale achievements,
A questão que motiva a minha investigação é esta:

[198] 07:50these really big things
Se virmos as grandes conquistas da humanidade,

[199] 07:52that humanity has gotten together and done historically --
as coisas realmente grandiosas

[200] 07:55like for example, building the pyramids of Egypt
em que a humanidade se juntou e fez história

[201] 07:57or the Panama Canal
- como a construção das pirâmides do Egipto

[202] 07:59or putting a man on the Moon --
ou do canal do Panamá

[203] 08:01there is a curious fact about them,
ou pôr um homem na Lua -

[204] 08:03and it is that they were all done with about the same number off people.
há um facto curioso relacionado com elas:

[205] 08:05It's weird; they were all done with about 100,000 people.
todas foram feitas com quase o mesmo número de pessoas.

[206] 08:08And the reason for that is because, before the Internet,
É estranho; todas foram feitas com cerca de 100 000 pessoas.

[207] 08:11coordinating more than 100,000 people,
E a razão para isso é que, antes da Internet,

[208] 08:13let alone paying them, was essentially impossible.
coordenar mais do que 100 000 pessoas,

[209] 08:16But now with the Internet, I've just shown you a project
quanto mais, pagar-lhes, era quase impossível.

[210] 08:18where we've gotten 750 million people
Mas agora, com a Internet, mostrei um projeto

[211] 08:20to help us digitize human knowledge.
em que temos 750 milhões de pessoas

[212] 08:22So the question that motivates my research is,
que nos ajudam a digitalizar o conhecimento humano.

[213] 08:24if we can put a man on the Moon with 100,000,
Assim, o motive da minha investigação é:

[214] 08:27what can we do with 100 million?
se conseguimos pôr um homem na Lua com 100 000 pessoas,

[215] 08:29So based on this question,
o que conseguiremos fazer com 100 milhões?

[216] 08:31we've had a lot of different projects that we've been working on.
Com base nesta questão,

[217] 08:33Let me tell you about one that I'm most excited about.
estamos a trabalhar em muitos projetos diferentes

[218] 08:36This is something that we've been semi-quietly working on
Vou falar-vos sobre aquele que mais me entusiasma.

[219] 08:38for the last year and a half or so.
É uma coisa em que temos estado a trabalhar discretamente

[220] 08:40It hasn't yet been launched. It's called Duolingo.
no último ano e meio.

[221] 08:42Since it hasn't been launched, shhhhh!
Ainda não foi lançado. Chama-se Duolingo.

[222] 08:44(Laughter)
Como ainda não foi lançado, shhhhh!

[223] 08:46Yeah, I can trust you'll do that.
(Risos)

[224] 08:48So this is the project. Here's how it started.
Sim, confio que vão fazer isso.

[225] 08:50It started with me posing a question to my graduate student,
O projeto é este. Começou assim.

[226] 08:52Severin Hacker.
Fiz uma pergunta a um estudante já licenciado,

[227] 08:54Okay, that's Severin Hacker.
Severin Hacker.

[228] 08:56So I posed the question to my graduate student.
Este é o Severin Hacker.

[229] 08:58By the way, you did hear me correctly;
(Risos)

[230] 09:00his last name is Hacker.
Fiz uma pergunta ao meu aluno.

[231] 09:02So I posed this question to him:
Já agora, vocês ouviram bem,

[232] 09:04How can we get 100 million people
o apelido dele é Hacker.

[233] 09:06translating the Web into every major language for free?
Fiz-lhe esta pergunta:

[234] 09:09Okay, so there's a lot of things to say about this question.
"Como conseguir que 100 milhões de pessoas

[235] 09:11First of all, translating the Web.
"traduzam a web, de graça, para as principais línguas?"

[236] 09:13So right now the Web is partitioned into multiple languages.
Há muitas coisas a dizer acerca disto.

[237] 09:16A large fraction of it is in English.
Em primeiro lugar: traduzir a Web.

[238] 09:18If you don't know any English, you can't access it.
A web está dividida em várias línguas.

[239] 09:20But there's large fractions in other different languages,
Uma grande parte dela está em inglês.

[240] 09:22and if you don't know those languages, you can't access it.
Se não soubermos inglês, não conseguimos percebê-la.

[241] 09:25So I would like to translate all of the Web, or at least most of the Web,
Mas há grandes frações noutras línguas.

[242] 09:28into every major language.
Se não soubermos essas línguas, não as percebemos.

[243] 09:30So that's what I would like to do.
Por isso, gostaria de traduzir toda a web, ou a maior parte dela,

[244] 09:32Now some of you may say, why can't we use computers to translate?
em todas as línguas principais.

[245] 09:35Why can't we use machine translation?
É o que eu gostaria fazer.

[246] 09:37Machine translation nowadays is starting to translate some sentences here and there.
Poderão dizer:

[247] 09:39Why can't we use it to translate the whole Web?
"Porque é que não usamos computadores para traduzir?

[248] 09:41Well the problem with that is that it's not yet good enough
"ou tradução automática?

[249] 09:43and it probably won't be for the next 15 to 20 years.
"A tradução automática já começa a traduzir algumas frases.

[250] 09:45It makes a lot of mistakes.
"Porque não usá-la para toda a web?"

[251] 09:47Even when it doesn't make a mistake,
O problema é que ela ainda não é grande coisa

[252] 09:49since it makes so many mistakes, you don't know whether to trust it or not.
nem o será, nos próximos 15 ou 20 anos.

[253] 09:52So let me show you an example
Faz imensos erros.

[254] 09:54of something that was translated with a machine.
Por causa disso, não sabemos se podemos confiar nela ou não

[255] 09:56Actually it was a forum post.
Vou mostrar-vos um exemplo

[256] 09:58It was somebody who was trying to ask a question about JavaScript.
duma coisa que foi traduzida automaticamente.

[257] 10:01It was translated from Japanese into English.
Tratava-se de um post de um fórum.

[258] 10:04So I'll just let you read.
Alguém queria fazer uma pergunta sobre JavaScript.

[259] 10:06This person starts apologizing
Foi traduzida de japonês para inglês.

[260] 10:08for the fact that it's translated with a computer.
[...Agradeço computador traduzir ajudar. Desculpem!]

[261] 10:10So the next sentence is is going to be the preamble to the question.
Esta pessoa começa por pedir desculpa

[262] 10:13So he's just explaining something.
por estar a traduzir com um computador.

[263] 10:15Remember, it's a question about JavaScript.
A próxima frase é o preâmbulo da questão.

[264] 10:19(Text: At often, the goat-time install a error is vomit.)
Está apenas a explicar.

[265] 10:23(Laughter)
Lembrem-se, é uma questão sobre o JavaScript.

[266] 10:27Then comes the first part of the question.
[Frequentemente, o tempo de cabra instalar um erro é vómito".)

[267] 10:30(Text: How many times like the wind, a pole, and the dragon?)
(Risos)

[268] 10:34(Laughter)
Depois vem a primeira parte da pergunta.

[269] 10:36Then comes my favorite part of the question.
[Quantas vezes como o vento, um polo, e o dragão?)

[270] 10:39(Text: This insult to father's stones?)
(Risos)

[271] 10:42(Laughter)
Depois vem a minha parte preferida da pergunta

[272] 10:44And then comes the ending, which is my favorite part of the whole thing.
[Este insulto às pedras do pai?]

[273] 10:47(Text: Please apologize for your stupidity. There are a many thank you.)
(Risos)

[274] 10:51(Laughter)
E por fim, a minha parte favorita disto tudo.

[275] 10:53Okay, so computer translation, not yet good enough.
[Por favor peçam desculpa pela vossa estupidez. Há imensos obrigado]

[276] 10:55So back to the question.
(Risos)

[277] 10:57So we need people to translate the whole Web.
A tradução por computadores, ainda não é grande coisa.

[278] 11:00So now the next question you may have is,
Voltando à nossa questão:

[279] 11:02well why can't we just pay people to do this?
Precisamos de pessoas que traduzam toda a web.

[280] 11:04We could pay professional language translators to translate the whole Web.
A próxima pergunta que podem ter é,

[281] 11:07We could do that.
"Porque é que não pagamos a pessoas para fazer isto?

[282] 11:09Unfortunately, it would be extremely expensive.
Podíamos pagar a tradutores profissionais para traduzir toda a web.

[283] 11:11For example, translating a tiny, tiny fraction of the whole Web, Wikipedia,
Podíamos fazer isso mas seria extremamente caro.

[284] 11:14into one other language, Spanish.
Por exemplo: traduzir uma fração minúscula de toda a web, a Wikipédia,

[285] 11:17Wikipedia exists in Spanish,
para uma outra língua, o espanhol.

[286] 11:19but it's very small compared to the size of English.
A Wikipédia existe em espanhol,

[287] 11:21It's about 20 percent of the size of English.
mas é muito pequena quando comparada com o inglês.

[288] 11:23If we wanted to translate the other 80 percent into Spanish,
É cerca de 20% do tamanho em inglês.

[289] 11:26it would cost at least 50 million dollars --
Se quiséssemos traduzir os outros 80% para espanhol,

[290] 11:28and this is at even the most exploited, outsourcing country out there.
custar-nos-ia, pelo menos, 50 milhões de dólares,

[291] 11:31So it would be very expensive.
mesmo no país fornecedor mais explorado que existe.

[292] 11:33So what we want to do is we want to get 100 million people
Seria extremamente caro.

[293] 11:35translating the Web into every major language
Queremos que haja 100 milhões de pessoas

[294] 11:37for free.
a traduzir a web, de graça, em todas as línguas principais,

[295] 11:39Now if this is what you want to do,
Se queremos fazer isto,

[296] 11:41you pretty quickly realize you're going to run into two pretty big hurdles,
percebemos logo que há duas barreiras bem grandes,

[297] 11:43two big obstacles.
dois grandes obstáculos.

[298] 11:45The first one is a lack of bilinguals.
A primeira é a falta de bilingues.

[299] 11:48So I don't even know
Nem sei se existem 100 milhões de utilizadores da web

[300] 11:50if there exists 100 million people out there using the Web
que sejam suficientemente bilingues para nos ajudar a traduzir.

[301] 11:53who are bilingual enough to help us translate.
Esse é um grande problema.

[302] 11:55That's a big problem.
Outro problema é a falta de motivação.

[303] 11:57The other problem you're going to run into is a lack of motivation.
Como é que vamos motivar as pessoas

[304] 11:59How are we going to motivate people
a traduzir a web de graça?

[305] 12:01to actually translate the Web for free?
Normalmente, é preciso pagar para isso.

[306] 12:03Normally, you have to pay people to do this.
Como é que as vamos motivar para o fazerem de graça?

[307] 12:06So how are we going to motivate them to do it for free?
A princípio, ficámos bloqueados por estes dois aspetos.

[308] 12:08Now when we were starting to think about this, we were blocked by these two things.
Mas depois percebemos que há uma maneira

[309] 12:11But then we realized, there's actually a way
de resolver ambos os problemas com a mesma solução.

[310] 12:13to solve both these problems with the same solution.
Podemos matar dois coelhos só com uma cajadada.

[311] 12:15There's a way to kill two birds with one stone.
E isso faz-se transformando a tradução

[312] 12:17And that is to transform language translation
numa coisa que milhões de pessoas queiram fazer,

[313] 12:20into something that millions of people want to do,
e que também diminua o problema da falta de bilingues.

[314] 12:23and that also helps with the problem of lack of bilinguals,
Faz-se isso através da educação linguística.

[315] 12:26and that is language education.
Acontece que, hoje em dia,

[316] 12:29So it turns out that today,
há mais de 1,2mil milhões de pessoas a aprender uma língua estrangeira.

[317] 12:31there are over 1.2 billion people learning a foreign language.
As pessoas querem imenso aprender uma língua estrangeira.

[318] 12:34People really, really want to learn a foreign language.
Não é por estarem a ser forçadas a aprender na escola.

[319] 12:36And it's not just because they're being forced to do so in school.
Só nos EUA, há mais de 5 milhões de pessoas

[320] 12:39For example, in the United States alone,
que pagaram mais de 500 dólares

[321] 12:41there are over five million people who have paid over $500
por software para aprenderem uma nova língua.

[322] 12:43for software to learn a new language.
As pessoas querem mesmo aprender uma nova língua.

[323] 12:45So people really, really want to learn a new language.
Por isso, no último ano e meio, temos trabalhado

[324] 12:47So what we've been working on for the last year and a half is a new website --
num novo website, chamado Duolingo,

[325] 12:50it's called Duolingo --
onde a ideia principal é que as pessoas aprendam uma nova língua de graça

[326] 12:52where the basic idea is people learn a new language for free
ao mesmo tempo que traduzem a web.

[327] 12:55while simultaneously translating the Web.
Ou seja, aprendem fazendo.

[328] 12:57And so basically they're learning by doing.
Funciona assim:

[329] 12:59So the way this works
quando se trata de um principiante, damos-lhe frases muito simples.

[330] 13:01is whenever you're a just a beginner, we give you very, very simple sentences.
Claro que há imensas frases simples na web.

[331] 13:04There's, of course, a lot of very simple sentences on the Web.
Frases muito simples juntamente com o significado de cada palavra.

[332] 13:06We give you very, very simple sentences
À medida que se traduz, à medida que se vê como as outras pessoas as traduzem,

[333] 13:08along with what each word means.
começa-se a aprender a língua.

[334] 13:10And as you translate them, and as you see how other people translate them,
E à medida que vai avançando,

[335] 13:13you start learning the language.
damos-lhe frases mais complexas para traduzir.

[336] 13:15And as you get more and more advanced,
Mas está-se sempre a aprender fazendo.

[337] 13:17we give you more and more complex sentences to translate.
O que é invulgar neste método é que realmente funciona.

[338] 13:19But at all times, you're learning by doing.
Primeiro, as pessoas estão a aprender uma língua.

[339] 13:21Now the crazy thing about this method
Já acabámos de o construir, agora estamos a testá-lo.

[340] 13:23is that it actually really works.
As pessoas aprendem uma língua

[341] 13:25First of all, people are really, really learning a language.
tão bem como com o melhor software de aprendizagem de línguas.

[342] 13:27We're mostly done building it, and now we're testing it.
As pessoas aprendem mesmo uma língua.

[343] 13:29People really can learn a language with it.
Não só aprendem uma língua,

[344] 13:31And they learn it about as well as the leading language learning software.
é muito mais interessante.

[345] 13:34So people really do learn a language.
Porque, com o Duolingo, as pessoas estão a aprender com conteúdos reais.

[346] 13:36And not only do they learn it as well,
Em vez de aprenderem com frases feitas,

[347] 13:38but actually it's way more interesting.
as pessoas aprendem com um conteúdo real, que é interessante.

[348] 13:40Because you see with Duolingo, people are actually learning with real content.
As pessoas aprendem uma língua.

[349] 13:43As opposed to learning with made-up sentences,
Mas talvez mais surpreendente do que isso,

[350] 13:45people are learning with real content, which is inherently interesting.
as traduções que obtemos através dos utilizadores do site,

[351] 13:48So people really do learn a language.
embora sejam de principiantes,

[352] 13:50But perhaps more surprisingly,
são tão precisas como as dos tradutores linguísticos profissionais,

[353] 13:52the translations that we get from people using the site,
o que é bastante surpreendente.

[354] 13:55even though they're just beginners,
Vou mostrar-vos um exemplo.

[355] 13:57the translations that we get are as accurate as those of professional language translators,
Esta frase foi traduzida de alemão para inglês.

[356] 14:00which is very surprising.
A de cima, é o original em alemão.

[357] 14:02So let me show you one example.
A do meio, é uma tradução em inglês

[358] 14:04This is a sentence that was translated from German into English.
feita por um tradutor profissional inglês

[359] 14:06The top is the German.
a quem pagámos 20 cêntimos por palavra pela tradução.

[360] 14:08The middle is an English translation
A de baixo, é a tradução dos utilizadores do Duolingo,

[361] 14:10that was done by somebody who was a professional English translator
nenhum dos quais sabia alemão

[362] 14:12who we paid 20 cents a word for this translation.
antes de começar a usar o site.

[363] 14:14And the bottom is a translation by users of Duolingo,
Como podem ver, é quase perfeita.

[364] 14:17none of whom knew any German
Claro que usamos aqui um truque

[365] 14:19before they started using the site.
para tornar as traduções tão boas como as dos tradutores profissionais.

[366] 14:21You can see, it's pretty much perfect.
Combinamos as traduções de vários principiantes

[367] 14:23Now of course, we play a trick here
para conseguir a qualidade de um único tradutor profissional.

[368] 14:25to make the translations as good as professional language translators.
Embora estejamos a combinar as traduções,

[369] 14:27We combine the translations of multiple beginners
o website consegue traduzir de forma bastante rápida.

[370] 14:30to get the quality of a single professional translator.
Vou mostrar a nossa estimativa

[371] 14:33Now even though we're combining the translations,
quanto à rapidez da tradução da Wikipédia

[372] 14:38the site actually can translate pretty fast.
de inglês para espanhol.

[373] 14:40So let me show you,
Lembrem-se, isto vale 50 milhões de dólares.

[374] 14:42this is our estimates of how fast we could translate Wikipedia
A tradução da Wikipédia para espanhol,

[375] 14:44from English into Spanish.
podia ser feita, em cinco semanas, com 100 000 utilizadores ativos,

[376] 14:46Remember, this is 50 million dollars-worth of value.
em cerca de 80 horas, com um milhão de utilizadores ativos.

[377] 14:49So if we wanted to translate Wikipedia into Spanish,
Como todos os projetos em que temos trabalhado tiveram milhões de utilizadores,

[378] 14:51we could do it in five weeks with 100,000 active users.
temos esperança que conseguiremos traduzir

[379] 14:54And we could do it in about 80 hours with a million active users.
muito depressa, com este projeto.

[380] 14:57Since all the projects that my group has worked on so far have gotten millions of users,
A coisa que mais me entusiasma no Duolingo

[381] 15:00we're hopeful that we'll be able to translate
é que penso que isto proporciona um modelo de negócio justo

[382] 15:02extremely fast with this project.
para a educação linguística.

[383] 15:04Now the thing that I'm most excited about with Duolingo
No atual modelo para a educação linguística,

[384] 15:07is I think this provides a fair business model for language education.
o aluno paga, ou seja,

[385] 15:10So here's the thing:
o aluno paga 500 dólares à Rosetta Stone.

[386] 15:12The current business model for language education
(Risos)

[387] 15:14is the student pays,
Este é o modelo de negócio atual.

[388] 15:16and in particular, the student pays Rosetta Stone 500 dollars.
O problema deste modelo de negócio

[389] 15:18(Laughter)
é que 95% da população mundial não tem 500 dólares.

[390] 15:20That's the current business model.
Por isso, é extremamente injusto para os mais pobres.

[391] 15:22The problem with this business model
É completamente favorecedor dos ricos.

[392] 15:24is that 95 percent of the world's population doesn't have 500 dollars.
Agora vejam, no Duolingo,

[393] 15:27So it's extremely unfair towards the poor.
como, enquanto aprendem,

[394] 15:30This is totally biased towards the rich.
estão a criar valor, estão a traduzir coisas

[395] 15:32Now see, in Duolingo,
que podíamos cobrar a alguém pelas traduções.

[396] 15:34because while you learn
É assim que poderíamos valorizar isto.

[397] 15:36you're actually creating value, you're translating stuff --
Como as pessoas estão a criar valor enquanto estão a aprender,

[398] 15:39which for example, we could charge somebody for translations.
não têm de pagar nada, pagam com o seu tempo.

[399] 15:42So this is how we could monetize this.
O que é mágico aqui é que elas estão a pagar com o seu tempo,

[400] 15:44Since people are creating value while they're learning,
mas é o tempo que teriam de gastar de qualquer maneira

[401] 15:46they don't have to pay their money, they pay with their time.
a aprender a língua.

[402] 15:49But the magical thing here is that they're paying with their time,
O Duolingo é bom porque proporciona um modelo de negócio justo

[403] 15:52but that is time that would have had to have been spent anyways
que não discrimina as pessoas pobres.

[404] 15:54learning the language.
O site é este.

[405] 15:56So the nice thing about Duolingo is I think it provides a fair business model --
(Aplausos)

[406] 15:59one that doesn't discriminate against poor people.
Obrigado.

[407] 16:01So here's the site. Thank you.
O site é este.

[408] 16:03(Applause)
Ainda não o lançámos,

[409] 16:11So here's the site.
mas se forem lá, podem inscrever-se para fazer parte do nosso beta privado,

[410] 16:13We haven't yet launched,
que irá começar dentro de três ou quatro semanas.

[411] 16:15but if you go there, you can sign up to be part of our private beta,
Ainda não lançámos este Duolingo.

[412] 16:18which is probably going to start in about three or four weeks.
Já agora, eu sou um porta-voz.

[413] 16:20We haven't yet launched this Duolingo.
O Duolingo é o trabalho de uma equipa fantástica,

[414] 16:22By the way, I'm the one talking here,
estão aqui alguns dos seus membros.

[415] 16:24but actually Duolingo is the work of a really awesome team, some of whom are here.
Obrigado.

[416] 16:27So thank you.
(Aplausos)

[417] 16:29(Applause)
--417--