Рабочие листы
к вашим урокам
Скачать
1 слайд
Презентация к дипломной работе
Разработка многопрофильной системы информационного поиска
2 слайд
Основные компании
Amazon
Google
Яндекс
Amazon
Twitter
Microsoft
3 слайд
Характеристики сложноструктурированных данных
Внутренняя интерпретация.
Наличие внутренней структуры связей.
Шкалирование.
Погружение в пространство с семантической метрикой.
Наличие активности.
4 слайд
Используемые алгоритмы
PageRank
DBScan
Rock
Наивный байесовский классификатор
Семантические сети
5 слайд
Области применения системы информационного поиска
Поиск информации.
Формирование рекомендаций.
Установление авторства.
Проверка на плагиат.
Автоматическая генерация текстов для SEO (поисковой оптимизации).
Лингвистический анализ литературных текстов.
Корректировка текстов и исправление опечаток.
6 слайд
Алгоритм PageRank
Каждой странице присваиваем вес равной единице.
Подсчитываем количество исходящих связей для каждой страницы.
Вычисляем ранг каждой страницы с помощью формулы. Где A – страница, ранг которой необходимо найти, C(T1) – количество исходящих ссылок, d – коэффициент затухания.
7 слайд
Место для блок-схемы
8 слайд
Алгоритм ROCK
Procedurecluster (S, k)
Begin
1. link := compute-links (S)//Вычисляем связи в множестве точек S
2. for each s from S do
3. q[s] := build-local-heap (link,S)//Из каждой точки множества S на основе связей формируем кластер
4. Q:=build-global-heap (S,q) //Содержит список всех кластеров множества S
5. whilesize (Q) >kdo {//Формируем кластеры, точки, которых имеют максимальное число связей до тех пор, пока не получим желаемое число кластеров
6. u := extract-max (Q)
7. v := max (q[u])
8. delete (Q,v)
9. w:= merge (u,v)
10. for each x from (q[u] or q[v]) do {
11. link [x,w] := link [x,u] + link [x,v]
12. delete (q[x],u); delete (q[x],v)
13. insert (q[x],w,g(x,w)); insert (q[w],x,g(x,w));
14. update (Q,x,q[x])
15. }
16. insert (Q,w,q[w])//Добавляем кластер в список всех кластеров
17. deallocate (q[u]); deallocate (q[v]);
18. }
end.
9 слайд
Алгоритм DBSCAN
public List<Cluster> cluster() {
int clusterId = getNextClusterId();
for(DataPointp : points) {
if(isUnclassified(p) ) {//Проверяем классифицировали ли мы данную точку.
boolean isClusterCreated = createCluster(p, clusterId); //Создаемкластердлякаждойточки
if( isClusterCreated ) {
clusterId = getNextClusterId();
}
}
}
List<Cluster> allClusters = new ArrayList<Cluster>();
for(Map.Entry<Integer, Set<DataPoint>> e : clusters.entrySet()) {
String label = String.valueOf(e.getKey());//Создаем кластер и имя длянего
Set<DataPoint> points = e.getValue();
if( points != null && !points.isEmpty() ) {
Cluster cluster = new Cluster(label, e.getValue());
allClusters.add(cluster);
}
}
returnallClusters;//Возвращаем список всех кластеров, которые были созданы
}
10 слайд
Алгоритм DBSCAN
private boolean createCluster(DataPoint p, Integer clusterId){
Set<DataPoint> nPoints = findNeighbors(p, eps);
if( nPoints.size() < minPoints ) {
assignPointToCluster(p, CLUSTER_ID_NOISE);//Есликоличествоточекокружностименьше, чемminPoints, присваиваемточкезначение «Шум»
isClusterCreated = false;
} else {
assignPointToCluster(nPoints, clusterId); //Иначедобавляемточкувкластер
nPoints.remove(p);//Удаляем точку из рассмотрения
while(nPoints.size() > 0 ) { //Просматриваем все точки, если нашли точку, которую уже рассматривали то ставим ей статус пограничной, добавляем в кластер и удаляем из рассмотрения
DataPoint nPoint = nPoints.iterator().next();
Set<DataPoint> nnPoints = findNeighbors(nPoint, eps);
if( nnPoints.size() >= minPoints ) {
for(DataPoint nnPoint : nnPoints ) {
if( isNoise(nnPoint) ) {
assignPointToCluster(nnPoint, clusterId); //Добавляемточкуккластеру
} else if( isUnclassified(nnPoint) ){
nPoints.add(nnPoint);
assignPointToCluster(nnPoint, clusterId);} } }
nPoints.remove(nPoint); //Удаляемточкуизрассмотрения
}
isClusterCreated = true;
}
return isClusterCreated;
}
11 слайд
Наивный байесовский классификатор
Место для блок-схемы.
Рабочие листы
к вашим урокам
Скачать
6 656 356 материалов в базе
Настоящий материал опубликован пользователем Замараева Людмила Васильевна. Инфоурок является информационным посредником и предоставляет пользователям возможность размещать на сайте методические материалы. Всю ответственность за опубликованные материалы, содержащиеся в них сведения, а также за соблюдение авторских прав несут пользователи, загрузившие материал на сайт
Если Вы считаете, что материал нарушает авторские права либо по каким-то другим причинам должен быть удален с сайта, Вы можете оставить жалобу на материал.
Удалить материалВаша скидка на курсы
40%Курс профессиональной переподготовки
500/1000 ч.
Курс профессиональной переподготовки
300/600 ч.
Курс профессиональной переподготовки
300/600 ч.
Курс повышения квалификации
72/180 ч.
Мини-курс
3 ч.
Мини-курс
10 ч.
Оставьте свой комментарий
Авторизуйтесь, чтобы задавать вопросы.