jaromir działo -...
TRANSCRIPT
Jaromir Działo
Ludność: 56 800 000
Powierzchnia: ok. 4 600 000 km^2
Jednostka monetarna:
denar, sestercja, as, aureus, solid
Oszacowanie:
Czas wykonania: stulecia
Koszt wystartowania:
miliony ofiar
Ludność: 1 000 000 000
Powierzchnia: cały świat
Jednostka monetarna:
FB Credits
Oszacowanie:
Czas wykonania: 8 lat
Koszt wystartowania:
pizza + coca-cola
Dziennie powstaje:
60,000 nowych
website’ów
1,5 milionów
artykułów na blogach
10 milionów postów
na tumblr
140 miliony tweetów
1,5 miliarda różnego
rodzaju wpisów na
facebooku
Ludzie mają znacznie więcej dokumentów, niż są w stanie przeczytać lub
efektywnie nimi zarządzać. Naszym zadaniem jest odpowiedź na pytanie, co
robić po znalezieniu ciekawych dokumentów, kiedy nadal jest zbyt dużo do
przeczytania. W zbyt gęsto upakowanym tekście można zgubić sens. Badania
wykazały, że niektórzy z Państwa całkowicie pominą to ostatnie, długie zdanie,
szczególnie, jeśli niepoprawne formatowanie sprawi, że będzie wyglądać
nieatrakcyjnie, i to pomimo, że jest dłuższe niż poprzednia część tekstu.
Mamy zbyt dużo do przeczytania ..
Ludzie mają znacznie więcej dokumentów, niż są w stanie przeczytać lub
efektywnie nimi zarządzać. Naszym zadaniem jest odpowiedź na pytanie, co
robić po znalezieniu ciekawych dokumentów, kiedy nadal jest zbyt dużo do
przeczytania. W zbyt gęsto upakowanym tekście można zgubić sens. Badania
wykazały, że niektórzy z Państwa całkowicie pominą to ostatnie, długie zdanie,
szczególnie, jeśli niepoprawne formatowanie sprawi, że będzie wyglądać
nieatrakcyjnie, i to pomimo, że jest dłuższe niż poprzednia część tekstu.
Mamy zbyt dużo do przeczytania ..
.. niech komputer pomoże nam czytać
Topicmarks can semantically summarize, tag, find relations and organize
large collections of documents automagically. It helps creating presentations,
documents and concept maps.
Facts
1. Lego Tetrix is fully compatible with Lego Technic
2. Mindstorms is part of Lego’s broader educational
efforts
3. Lego WeDo set is aimed at elementry school age
children
Facts
1. Lego Tetrix is fully compatible with Lego Technic
2. Mindstorms is part of Lego’s broader educational
efforts
3. Lego WeDo set is aimed at elementry school age
children
Client
e.g. portal,
browser
extension,
rest API sentence splitter
tokenizer (sentence into words)
sentence parser
fact generation (building semantic
relations from parsed sentences)
terms extraction
semantic document representation
Distributed on (1..n) servers
Knowledge
base storage
semantic
data model
indexing
text search
engine
Cluster of DB servers
RDF model
Front-end servers
wrapper
induction
PDF Wrapper
HTML Wrapper
Custom Wrapper
e.g. WIKIPEDIA
Upload
DOC Wrapper
Text processing pipeline
there are over 30 processors implemented
in the grammar analyzer pipeline,
switched on/off when needed
cache
● Technology difficult to duplicate
● ~20,000 engineering hours invested
● Solves hard natural language processing problems
● Advanced string and graph-theoretic algorithms
● Requires large system architecture design
● Harnesses web intelligence via Web2.0/3.0 APIs
● Makes advanced human-machine collaboration
● Accessible to the casual user
Published USPO patent
● Title: "Method and System for Generating a Document
Representation"
● Filed March 5, 2010; priority March 6, 2009
● Total number of claims: 42
The many engineering hours invested, proprietary
algorithms and a patent make duplication unrealistic
● Analiza dokumentów WikiLeaks
● Procesowanie kanałów RSS
● Analiza Press Releasów giełdowych
Feedback użytkowników:
● student dziękował za "5-tkę", którą otrzymał za wygenerowane streszczenie
● blogger używał Topicmarks do procesowania swoich artykułów pod kątem
zrozumiałości – "jeśli maszyna to zrozumie, to może większość ludzi też"
● ktoś generował meta tagi pod SEO
● ktoś przeprocesował list miłosny od swojej dziewczyny.. i dziękował, że tylko
dzięki temu go zrozumiał (?!)
● Jaką potrzebę zaspokaja Twój produkt?
A jaką potrzebę zaspokajał Twitter ...?
● Czy znasz swoich Klientów?
A kiedy ostatnio rozmawiałeś ze swoim użytkownikiem?
● Kto usłyszy o Twoim produkcie?
Da się bez wykładania „dużych pieniędzy”?
● Dlaczego uważasz, że masz mocny zespół?
Masz super pomysł. Ale dlaczego właśnie Tobie uda się go zrealizować?
● Gdzie są pieniądze?
EU: show me the money..
US: .. or huge growth
Jesteś sprytny.
Twoje cele też maja być SMART
● Specific
● Measurable
● Acceptable
● Real
● Timed
● Kto jest Twoim sojusznikiem?
● Czy jesteś gotowy na inwestora?
● W czym potrzebujesz wsparcia?
“Topicmarks .. a real need for millions”
May 2010, a winner of
Capital is liquid.
Capitalists are not.
● inwestorzy: nie tylko
„Sand Hill Road”
● co-working spaces:
Pier38, SOMACentral,
PariSoma
● media w co drugim
(ponieważ same też
często są startupem)
● spotkania branżowe
● prawnicy pracujący „za
darmo” (do momentu
zdobycia finansowania)
Wyjątkowy pomysł? Niekoniecznie.
Odpowiedni moment wejścia na rynek? Bardziej.
Znajomości? Przede wszystkim.
Grand Prize Winner by 66% audience vote and 88% jury points
“Potentially huge—Jeff Clavier” “Solving a very interesting problem”
“Nerdy winner of the night”
Thought through very well” “A ripe acquisition target”
:)
“Made for […] denser documents”
“Find a new friend in Topicmarks”
● 6 inwestorów oraz 5 advisorów, wśród nich:
• Aaron Patzer (Mint.com [$170m] => Intuit)
• Adeo Ressi (Founder Institute)
• Peter Berger II (Silicon Valley Semantic
Technology Forum)
• Jeannie Kahwajy (Adviser to Hillary Clinton)
● koncepcja nowego produktu
● bezcenne kontakty
● współpraca przy procesowaniu repozytoriów
Cloud (Evernote, Google Docs, Dropbox,
BOX.net)
Biuro Topicmarks w San
Francisco
a „za ścianą” mamy:
● Mashable
● Wordpress
● Zite
● Socialize
oraz
● Stadion Baseballa
GO GIANTS!!
● jest jedną z największych sieci społecznościowych
● ogromna skala - ok. 330mln użytkowników
● na „plusie” od 4 lat
● działa w tematyce „social discovery”, poznawania
ciekawych ludzi
● po drugiej stronie ekranu są LUDZIE
● tam gdzie są ludzie są EMOCJE
● PO CO ludzie używają FB?
Poznajmy naszych użytkowników:
● kto przychodzi?
● co ogląda?
● jak długo?
● czy wraca?
● .. dlaczego?
Znasz swoich użytkowników?
A kiedy ostatnio rozmawiałeś z nim przy kawie?